共计 4026 个字符,预计需要花费 11 分钟才能阅读完成。
在最近落幕的 Google I/O 大会上,Google 低调推出了一款新旧交替的应用——NotebookLM,它同时在安卓和 iOS 平台上线。值得注意的是,这款应用在发布后的短短 24 小时内,便在苹果 App Store 的生产工具分类中跃居第二名。
2023 年推出的 NotebookLM 此前仅限于桌面版本
NotebookLM 于 2023 年首次亮相,初期功能主要是作为拆解文档的知识库,然而到了 2024 年,当新增了“音频概览”功能后,这款应用开始引起广泛关注。
甚至连 OpenAI 的创始成员 Andrej Karpathy 在体验过 Google NotebookLM 后,也不禁感慨,这让他联想到了最初的“ChatGPT 时刻”。
与我们这两年熟悉的 AI 问答工具有所不同,NotebookLM 在用户提出问题之前,会要求先上传相关的多媒体资料。它的回答是建立在用户提供的知识基础之上的,属于一种源基础的回答模式。这款 基于 AI 技术的笔记应用,因此而焕发新生。
经过功能更新,NotebookLM 现在支持生成 10 分钟左右的 AI 双人播客,能够将原本结构化的知识文本转化为生动的音频,语调、语速乃至幽默感都极具人情味。更令人惊喜的是,当文本被音频化后,AI 展现出讲故事和提炼重点的能力,声音中能体现出高亮效果……虽然繁琐的学术论文难以一气呵成,但轻松的相声却能在路上快速听完。
值得一提的是,NotebookLM 支持生成中文播客,只需在生成前将导出语言设置为中文。与英文播客相比,中文播客在呈现上显得更为自然。
流量分析平台 SimilarWeb 的数据显示,自去年 11 月以来,NotebookLM 的月访问量在半年的时间内增长了 56%,已经突破了四千八百万的访问量。不久前,Google 还推出了独立的手机版,结合“声音快餐”和移动使用场景,预计使用量将会再次倍增。
AI 时代的笔记本是什么样的
启动 NotebookLM 后,首先映入眼帘的是一个个分类明确的自建主题。在创建新主题时,系统会要求用户上传素材,包括会议记录、课堂笔记和研究文献等。目前,它支持多种格式的文本文档、带有手写笔记的幻灯片、PDF 文件、网页(建议将中文网页转换为 PDF 再导入)以及丰富的网络资源——如 YouTube 视频!
将资料一并上传后,界面看起来就像一个专注于特定研究主题的问答机器人。AI 会充分吸收先前上传的多种媒体资源,并将其转化为用户深入提问所需的上下文背景。
如图所示,AI 已经为你整理好了相关资料。如果你有明确的问题,可以直接在输入框中询问。如果你像大多数人一样感到无从下手,AI 贴心地提供了一些高质量的问题,悬浮在输入框下方,且这些问题会不断更新生成。
NotebookLM 的回应几乎每一句话都有索引,并且不仅仅是定位到某个素材,而是细化到该素材中讨论当前部分的具体位置。
若用户提出的问题在资料库内并不存在,AI 便会直接回复:“无法回答”。
如果你上传的素材内容非常多样,AI 的“思维导图”功能就会显得尤为有用。它会将不同资料整合,展示出逻辑关系和关联性。如果需要更深入的内容,可以逐层查看,找到想要探讨的知识点后,点击该点,AI 将在整体语义和上下文中帮助你划出重点。
标题:NotebookLM:一位智能助手的多样化应用与创新在笔记区,诸如“学习指南”、“简报文档”、“常见问题解答”以及“时间轴”等功能,皆能助你有效地突出重点。由此可见,NotebookLM 更像是一位优秀的学习伙伴,它在快速浏览信息后,提供给你一本经过精心提炼的笔记本,并对其所传达的每一句话负责。
由于其具备源数据基础的特性,NotebookLM 的虚假信息产生概率有所降低。然而,这也意味着它无法像 ChatGPT 那样进行自由发散的回答,举一反三的能力较弱。在使用 NotebookLM 时,我几乎不担心 AI 会胡编乱造,最有可能的误解来自于我看到一张扩展的思维导图,感觉自己似乎掌握了过多的信息……
文本生成“相声”,这种玩法可不简单
NotebookLM 之所以能够在人工智能产品的竞争中脱颖而出,关键在于其“音频概览”功能。其操作也相当简便,你只需上传相关资料,明确指定 AI 主播需要重点讲解的素材或子主题,同时提供你的角色、背景及职务,清晰阐述你收听生成播客的目的。只需几分钟,节目便会随之而来。
科技博主 @宝玉 xp 在研究过程中总结出,播客需结合“热情讲述者与冷静分析者”的双声部形式,针对时间紧迫却追求深度的学习者,提供既客观又趣味盎然的见解,使得听众能够迅速获得有价值的认知。这样的知识获取方式并不直接替代阅读,NotebookLM 在特定情境中展现了其实用性。
NotebookLM 的产品负责人 Raiza Martin 曾在家中尝试播放这些播客,当时她的丈夫对持续播放表示不满,而 Raiza 心里暗自高兴,对方并未察觉这其实是 AI 在进行表演。
例如,当 AI 主播提到“3%”这一需要强调的比例时,会在此词汇上加重语气,这种方式的声音高亮感与真人相似,有助于加深我们的记忆。
更为贴心的是,在播客播放期间,如果你发现 AI 并没有触及你想要了解的内容,可以直接点击“加入”按钮打断他们,提出问题。
想象一下,你正在规划一场去巴厘岛的旅行,已经将《孤独星球》和各类攻略导入到系统中,开始让 AI 主播推荐景点。此时,小孩放学回家,你才意识到自己忘了照顾孩子的需求。这时,你可以中断 AI,请求他们介绍适合亲子活动的景点……等你真正抵达旅游地时,再打断主播,让他们为你提供实时导览,NotebookLM 就如同耳机里的导游。
当然,使用工具的方式各有千秋。
有些人会将自己的简历上传,AI 主播则会对每一条职业经历给予高度赞美,仿佛组成了一个三人“夸夸群”。他们称赞你的前瞻性和专业深耕,尽管教育背景与工作经历存在差异,依然会说你的能力转移得当,让你忍不住笑着感慨“AI 真懂我”。
还有人会在工作会议中走神,将录音整理上传给 AI 主播,随后在工位上收听生动的会议概要,这显然比领导的枯燥发言更容易消化。
不少用户担心长辈接触到过多的不实信息,因此他们收集可靠的出版物,制作“十分钟听完一本书”系列,这种“听书”形式低幻觉,内容真实可靠。
以上案例均属于内容消费,然而也有用户开始进行内容创作。
例如,OpenAI 的创始成员 Andrej Karpathy 利用两个小时制作出了十集的播客《Histories of Mysteries》,他首先通过搜索引擎、ChatGPT 和 Claude 来确定主题,然后再将“亚特兰蒂斯”的维基百科条目传输给 NotebookLM,节目的制作就此完成。
《Histories of Mysteries》中的一集,讲述了“wow!信号”的故事。
举个例子,一位内容创作者开发了一款浏览器插件,能够将 B 站视频中的字幕进行抓取,并导入 NotebookLM 进行分析。他对此前的另一位博主产生了浓厚的兴趣,经过集中分析对方的文案风格,从而为自己的创作获取灵感。
综合来看,NotebookLM 的对话式互动以及播客生成功能,彻底改变了传统上被动接受知识的方式(例如听讲座),使学习者能够主动收集信息并进行互动。在传统教育环境中,实现持续且高层次的学习常常面临诸多挑战。
常规之外的 Google 产品创新
在最近举行的 Google I/ O 大会上,Google 宣布将专为教育场景优化的 AI 模型 LearnLM 整合进 Gemini 2.5 和 NotebookLM 中,进一步提升个性化和互动性教学内容的生成能力。值得注意的是,在 NotebookLM 推出后,Google 基于 LearnLM 发布了面向青少年的交互式科普百科全书——Learn About。
Learn About 界面
根据 TestingCatalog 的消息,NotebookLM 即将推出“Sparks”视频生成功能,该功能将 90% 的内容基于用户提供的素材,10% 则由 AI 进行补充。
而 Google 不久前也发布了 Veo 3,这是一款 AI 视频生成模型,只需撰写一段提示,便能一键生成与声音、背景音乐完美契合的视频作品。
若将 NotebookLM 的文稿撰写能力与 Veo 3 结合,必然会对知识分享领域的博主产生深远影响。你可能难以置信,因为 Veo 3 生成的成片效果就是如此:
NotebookLM 的诞生背后,有着丰富的故事。
NotebookLM 最初是一个“20% 项目”——这是 Google 的传统做法,允许员工将 20% 的时间投入到他们感兴趣的业余项目。该产品从 Google Labs 孵化而出,与大型企业相比,Google Labs 更像一家初创公司,流程简化,迭代和验证速度更快。
除了技术人员和工程师,团队还聘请了畅销科普作家的 Steven Johnson,让 AI 与真实的写作工作者进行碰撞与合作,深入研究作家在信息组织和写作方面的技巧。
NotebookLM 成功推出后,Google Labs 负责人 Josh Woodward 也兼任 Gemini 项目。他在接受采访时表示:“我确实认为提示词已经过时。”他主张与 AI 的互动不必再使用冗长的提示词。他认为,借助多模态生成的长上下文和 AI 的推理能力,用户意图能够被更好地捕捉。
小贴士:利用 NotebookLM 的免费版,可以上传最多 50 个素材。如果你对某个新主题产生浓厚兴趣,可能不需要达到 50 个素材,但若是想要深入研究曾经花费大量精力的主题,升级到 Pro 版就会显得尤为必要。这样一来,你可以将整本书籍、长视频、长音频和丰富的板书内容,以及该主题的最新进展整合在一起,从而巩固对旧知识的理解,并引入新的动态补充。
通过搜索 Gemini Student,可以领取免费的 Google One 会员,享受包括 NotebookLM 在内的所有 AI 服务会员资格。这样一来,你的 NotebookLM 便可以支持多达 500 个主题的研究,每个主题最多上传 300 个素材。
作者:biu
编辑:卧虫
图源:如无特别指出,图片均来自 Google 应用截图
封面图
本文来自果壳,未经授权不得转载。
如有需要请联系 sns@guokr.com