上个月谷歌的Gemini和Nano Banana那一阵之后
随之火爆全网的还有同为谷歌系产品的NotebookLM
这期内容,我将为大家详细讲解:
NotebookLM,到底是什么?
以及,它都能干些什么~
首先,什么是NotebookLM?
通俗地解释,NotebookLM是每个人的一个专属AI资料助手。
或者还可以用简单贴切的描述来进行解释:
一个私人知识库。
在这个知识库里,你能将一些你用得上的资料分类存放在不同的项目夹中。
具体能存放啥?
看看下面这个资料上传界面:
如图所示,几乎可以上传你现在能够想到的任何形式的文件,甚至是音频、网站、YouTube视频...
当然正如上周发布的那篇教大家用NotebookLM制作PPT的文章中提到的:
如果你实在没有啥资料可以上传,也可以直接在其中进行联网搜索,然后手动筛选出自己想要的资料。
那上传完这些资料后能干嘛?
正如上面所讲,这可以当作是一个知识库。
那作为AI时代的一个知识库,最基本的功能是什么?
答案是基于知识库中的资料进行信息检索与问答。
所以一个最基本的用法就是AI可以结合这些资料来与你对话,这样做的好处相信已经不言而喻了~
受过大模型瞎bb的苦的人都懂...
那除此之外呢?NotebookLM还能做什么?
因为NotebookLM的底层能力是基于Gemini 3.0 Pro和Nano Banana Pro而来,所以还可以以各种形式来对这些资料进行多模态处理,比如以文字、图片、音视频等形式输出。
这是整个NotebookLM最核心的板块,也是本期内容我要分享的重点。
那,NotebookLM能干嘛?
上面提到,NotebookLM的核心能力是可以对指定的资料进行多模态处理,具体包括以下8种处理形式:
翻译过来分别是:
音频概述、视频概览、思维导图、报告、记忆卡片、测验、信息图、幻灯片。
其中,幻灯片,也就是PPT功能我已经在上周发表过的一篇文章中进行详细演示了,所以这期内容不再重复此功能。
大家可以先回顾一下那篇文章,其中也包含了对NotebookLM界面和操作的详细介绍:
小朱送你一程:手把手教你从0上手谷歌AI PPT
接下来,我们来对其它7个功能逐个进行讲解演示:
1.信息图(Infographic)
这里以我在电脑里放了很久但还没来得及看的一篇论文为例:
好的谷歌,是我无知了...
但到这里大家也发现了,这思维导图怎么还是纯英文的???
因为...
3.记忆卡片(Flashcards)
第三个是记忆卡片功能:
它对应的预设窗口是这样的:
严格按照下面的要求进行创作:
1.卡片正面的内容必须简短,以便记忆;
2.卡片的设计简约高级,富有质感,黑白灰主题色;
3.卡片上呈现的内容要求使用中文。
最终NotebookLM为我生成了60张记忆卡片:
先抛开其它不谈,这简洁的界面设计我是真心喜欢!
等等...该不会是用Gemini 3.0 Pro写的吧(狗头)...
这里还是给大家详细讲解一下这个所谓的记忆卡片到底怎么玩:
每一张卡片分为正反两面,正面为问题,反面为对应的答案。
我们可以通过鼠标点击卡片左右两边的两个小箭头来实现卡片的切换,以及通过卡片下方的小字“See answer”进行翻卡查询答案。
当然,以上动作也可以通过电脑键盘上的快捷键来操作。
比如点击空格进行翻页,点击左右两个方向键进行切换:
以及如果你看了问题的背后的答案依旧无法理解,也可以点击卡片左下角的Explain进行详细的知识点查看。
看到这里或许会有朋友也跟当时的我一样会好奇:
这玩意儿下载下来会是怎样的文件形式?
所以我就真的下载了下来,是CSV格式的文件,通过WPS就可以打开。
打开后是这样的:
4.测验(Quiz)
用记忆卡片把知识都记清楚了,那不得现场测一测?
必须的!
于是你可以在旁边继续选择生成Quiz:
5.报告(Reports)
当然,如果你是需要根据上面资料来撰写上面内容的话,NotebookLM也完全能够胜任,并且非常专业,你就看这格式类型分的吧:
6.音频概述(Audio Overview)
如果你不满足于以上那些生成的结果只能用眼睛看,也可以将资料转换为一段播客音频。
这里先不拿上面的论文来做Case,因为我想起了之前写过的关于史蒂夫·乔布斯生平的3篇文章。
这3篇文章大概涵盖了乔布斯的前半段生涯,我将3篇内容拼到了一起,然后扔给了NotebookLM,解析出来的总结是这样写的:
最上方包含了4种不同风格的播客形式,我给大家翻译一下:
我自己听下来整体感觉还是可以的,就是这个语速语气有时候略微有些许生硬。
还是期待后续能有更细节以及更个性化的设置吧。
接着,回归到上面用到的工业时序论文。
我对于生成的音频要求是这么写的:
专注于AIGC时序大模型的科普、发展概述及其作用意义
并且这次选择第2种格式:简短总结
怎么说呢...这个简短,是真的简短啊...
7.视频概览(Video Overview)
除了音频,你当然还可以让NotebookLM基于你的资料进行讲解视频的创作。
预设窗口中有两种视频类型供你选择:
这里我选择第一个。
并且,这里还有多种视频画面的视觉风格可以预设,以下是我的详细预设界面;
我只能感慨一句:
这nm视频时长我是真想不到!
原先我以为生成个一两分钟也就顶天了,谁知道上来就给我整了个将近8分钟...
至于效果层面,全程看下来,我印象中并没有出现像信息图中一样的文字崩坏。
画面配图的话,毕竟是基于Nano Banana Pro来的,整体观感上还是挺精细的,并且即便是提取论文原文当中的图片,画面的画质和其中的文字内容也都保持得非常好,不像其它一些AI会出现崩坏的情况。
为此我还特地打开原文翻出了原图来进行比对:
但即便整体下来还算不错(对于现阶段的AI来说),但也还是有一些不足的地方的。
就比如画面的构图很多都不够美观,以及一些画面或者插图都存在性是值得商榷的。
除此之外,我还观察到了比较细微的一点,就是视频的讲解配音的音色有时候会出现一些波动、不够统一。
至此,关于NotebookLM中最核心的8大功能板块我们全部演示完毕!
并且通过以上同样的一篇论文,我们可以收获类似下面这样多模态的信息样式:
当然如果你愿意的话,完全可以将我们上周讲到的AI PPT也加进去~
现在让我们将目光转到谷歌这家企业
就像这周一我发过的那篇文章中表达的观点那样:
AI时代的百团大战,或许谷歌才是最后的赢家~
而我同时也在期待:
国内也能诞生这样一个平台
这样一家企业~
| 欢迎光临 链载Ai (http://www.lianzai.com/) | Powered by Discuz! X3.5 |