|
上个月谷歌的Gemini和Nano Banana那一阵之后 随之火爆全网的还有同为谷歌系产品的NotebookLM 这期内容,我将为大家详细讲解: NotebookLM,到底是什么? 以及,它都能干些什么~ 首先,什么是NotebookLM? 通俗地解释,NotebookLM是每个人的一个专属AI资料助手。 或者还可以用简单贴切的描述来进行解释: 一个私人知识库。 在这个知识库里,你能将一些你用得上的资料分类存放在不同的项目夹中。 具体能存放啥? 看看下面这个资料上传界面: 如图所示,几乎可以上传你现在能够想到的任何形式的文件,甚至是音频、网站、YouTube视频... 当然正如上周发布的那篇教大家用NotebookLM制作PPT的文章中提到的: 如果你实在没有啥资料可以上传,也可以直接在其中进行联网搜索,然后手动筛选出自己想要的资料。 那上传完这些资料后能干嘛? 正如上面所讲,这可以当作是一个知识库。 那作为AI时代的一个知识库,最基本的功能是什么? 答案是基于知识库中的资料进行信息检索与问答。 所以一个最基本的用法就是AI可以结合这些资料来与你对话,这样做的好处相信已经不言而喻了~ 受过大模型瞎bb的苦的人都懂... 那除此之外呢?NotebookLM还能做什么? 因为NotebookLM的底层能力是基于Gemini 3.0 Pro和Nano Banana Pro而来,所以还可以以各种形式来对这些资料进行多模态处理,比如以文字、图片、音视频等形式输出。 这是整个NotebookLM最核心的板块,也是本期内容我要分享的重点。 那,NotebookLM能干嘛? 上面提到,NotebookLM的核心能力是可以对指定的资料进行多模态处理,具体包括以下8种处理形式: 翻译过来分别是: 音频概述、视频概览、思维导图、报告、记忆卡片、测验、信息图、幻灯片。 其中,幻灯片,也就是PPT功能我已经在上周发表过的一篇文章中进行详细演示了,所以这期内容不再重复此功能。 大家可以先回顾一下那篇文章,其中也包含了对NotebookLM界面和操作的详细介绍: 小朱送你一程:手把手教你从0上手谷歌AI PPT 接下来,我们来对其它7个功能逐个进行讲解演示: 1.信息图(Infographic) 这里以我在电脑里放了很久但还没来得及看的一篇论文为例: 这是一篇关于工业时序AI的论文,这篇论文也将贯彻本期内容中所有的功能演示。上传好NotebookLM解析好后的界面是这样的:然后我们点击infographic右侧的“钢笔图标”:其中Choose orientation是选择图幅比例,从左到右分别是横图、竖图以及1:1的正方形;Level of detail是选择画面整体的细节程度,这里我直接选择默认。全部设置完毕后点击右下角的Generate开始信息图的生成。不得不说还得是Nano Banana Pro,这图估计也就它能很好地跑下来了。但还是在上周那篇文章中我提到过的一个我的观察,即:单一个Nano banana Pro拎出来直接跑类似的图,画面中的文字几乎是不带任何崩坏的。但不知道为什么被集成到NotebookLM中后,文字能力有了些许的下降,会出现个别的文字崩坏。将画面的细节程度调到Concise,也就是简洁模式,这样跑起来大概率会更加稳定。然后缓过神来才发现后面的小尖标是可以点击一个个打开的,于是乎我便得到了这副玩意儿:好的谷歌,是我无知了... 但到这里大家也发现了,这思维导图怎么还是纯英文的??? 因为... 对的,目前Mind Map功能还不支持切换语言,甚至连预设键都没有...但这玩意儿真挺实用的,期待一下吧,期待支持切换语言的那一天~3.记忆卡片(Flashcards) 第三个是记忆卡片功能: 它对应的预设窗口是这样的: 其中Number of cards是控制卡片的数量,你可以选择较多或者较少,当然也可以像我一样直接保持默认的标准数量;‘Level of difficulty代表着生成的记忆卡片所包含知识点的难易程度,这里我同样选择默认的中等。严格按照下面的要求进行创作: 1.卡片正面的内容必须简短,以便记忆; 2.卡片的设计简约高级,富有质感,黑白灰主题色; 3.卡片上呈现的内容要求使用中文。
最终NotebookLM为我生成了60张记忆卡片: 先抛开其它不谈,这简洁的界面设计我是真心喜欢! 等等...该不会是用Gemini 3.0 Pro写的吧(狗头)... 这里还是给大家详细讲解一下这个所谓的记忆卡片到底怎么玩: 每一张卡片分为正反两面,正面为问题,反面为对应的答案。 我们可以通过鼠标点击卡片左右两边的两个小箭头来实现卡片的切换,以及通过卡片下方的小字“See answer”进行翻卡查询答案。 当然,以上动作也可以通过电脑键盘上的快捷键来操作。 比如点击空格进行翻页,点击左右两个方向键进行切换: 以及如果你看了问题的背后的答案依旧无法理解,也可以点击卡片左下角的Explain进行详细的知识点查看。 这里NotebookLM会对相应资料进行检索,并将详细的知识点呈现在界面中间点对话区域上;看到这里或许会有朋友也跟当时的我一样会好奇: 这玩意儿下载下来会是怎样的文件形式? 所以我就真的下载了下来,是CSV格式的文件,通过WPS就可以打开。 打开后是这样的: 4.测验(Quiz) 用记忆卡片把知识都记清楚了,那不得现场测一测? 必须的! 于是你可以在旁边继续选择生成Quiz: 与记忆卡片类似,上面两个设置分别是问题数量以及问题的难易程度。到这里大家可能也发现了,记忆卡片以及测验功能跟思维导图一样,目前是不支持切换语言的,都是使用的英文。即便在上文中对于记忆卡片的要求描述中我特地强调了要用中文,也于事无补~这时候就要考验大家伙儿的英语水平了,反正我是不行(狗头)5.报告(Reports) 当然,如果你是需要根据上面资料来撰写上面内容的话,NotebookLM也完全能够胜任,并且非常专业,你就看这格式类型分的吧: 你可以点击想要的格式右侧的钢笔小图标进行相应的预设,比如这里我想要生成的是播客文章,然后点击小图标后会弹出下面这个界面:在这个界面中会有一大段默认给好的提示词,你可以选择修改,也可以选择不作任何更改直接使用。最后点击生成,稍等片刻,一篇质量很高的与工业时序AI相关的博客文章就这么诞生了:6.音频概述(Audio Overview) 如果你不满足于以上那些生成的结果只能用眼睛看,也可以将资料转换为一段播客音频。 这里先不拿上面的论文来做Case,因为我想起了之前写过的关于史蒂夫·乔布斯生平的3篇文章。 这3篇文章大概涵盖了乔布斯的前半段生涯,我将3篇内容拼到了一起,然后扔给了NotebookLM,解析出来的总结是这样写的: 最上方包含了4种不同风格的播客形式,我给大家翻译一下: 再往下就是基本的语言设置、音频长度设置,以及你想要音频中着重表述什么的要求描述了。我自己听下来整体感觉还是可以的,就是这个语速语气有时候略微有些许生硬。 还是期待后续能有更细节以及更个性化的设置吧。 接着,回归到上面用到的工业时序论文。 我对于生成的音频要求是这么写的: 专注于AIGC时序大模型的科普、发展概述及其作用意义
并且这次选择第2种格式:简短总结 怎么说呢...这个简短,是真的简短啊... 7.视频概览(Video Overview) 除了音频,你当然还可以让NotebookLM基于你的资料进行讲解视频的创作。 预设窗口中有两种视频类型供你选择: 这里我选择第一个。 并且,这里还有多种视频画面的视觉风格可以预设,以下是我的详细预设界面; 视觉风格我选择的是最后一个:纸艺(Paper-craft)等待一段时间后(其实也没有很久),就可以得到下面的成果:我只能感慨一句: 这nm视频时长我是真想不到! 原先我以为生成个一两分钟也就顶天了,谁知道上来就给我整了个将近8分钟... 至于效果层面,全程看下来,我印象中并没有出现像信息图中一样的文字崩坏。 画面配图的话,毕竟是基于Nano Banana Pro来的,整体观感上还是挺精细的,并且即便是提取论文原文当中的图片,画面的画质和其中的文字内容也都保持得非常好,不像其它一些AI会出现崩坏的情况。 为此我还特地打开原文翻出了原图来进行比对: 但即便整体下来还算不错(对于现阶段的AI来说),但也还是有一些不足的地方的。 就比如画面的构图很多都不够美观,以及一些画面或者插图都存在性是值得商榷的。 除此之外,我还观察到了比较细微的一点,就是视频的讲解配音的音色有时候会出现一些波动、不够统一。 至此,关于NotebookLM中最核心的8大功能板块我们全部演示完毕! 并且通过以上同样的一篇论文,我们可以收获类似下面这样多模态的信息样式: 当然如果你愿意的话,完全可以将我们上周讲到的AI PPT也加进去~ 现在让我们将目光转到谷歌这家企业 就像这周一我发过的那篇文章中表达的观点那样: AI时代的百团大战,或许谷歌才是最后的赢家~ 而我同时也在期待: 国内也能诞生这样一个平台 这样一家企业~
|