共计 3561 个字符,预计需要花费 9 分钟才能阅读完成。
封面新闻记者 谭羽清 图片来源于网络
近日,科普作家及科技博主严伯钧吸引了众多粉丝的关注,他们在欣赏他讲解科学知识时,也参与了“真假严伯钧”的讨论。
评论区出现了不少这样的留言:“这视频是严伯钓制作的。”“严伯钓,快停止你的模仿,努力超越,成为真正的严伯钩。”以及“你到底是严伯钧还是严伯钓?”这反映了观众对其数字分身的关注。
所谓“严伯钓”,是严伯钧在 2023 年底首次介绍的“数字分身”。这个分身是他与硅基智能科技有限公司(以下简称“硅基智能”)团队共同研发的。由于严伯钧认为这个数字分身尚未达到理想的智能水平,因此称其为“严伯钓”。
近几年,伴随着人工智能(AI)技术的迅猛发展,数字人行业也在快速进步。从“严伯钓”的问世中,我们可以窥见数字人领域的“硅基生命”正迎来一个新的发展阶段,似乎正在开始“进化”出更深层次的“灵魂”。
那么,“严伯钓”究竟是如何诞生的?数字人未来的发展又将走向何方?最近,封面新闻记者与严伯钧及硅基智能的创始人兼 CEO 司马华鹏进行了深入对话。
科普作家及科技博主严伯钧
“铸体 + 画心”:
创造出具备创作能力的“数字克隆人”
目前,严伯钓已经掌握了严伯钧的两项核心技能——写作和录制视频。要创造出一个能自主创作的“数字克隆人”,需要经历哪些步骤呢?严伯钧表示,严伯钓的诞生分为三个阶段:形象克隆、声音克隆和思想克隆。
前两者的“克隆”可以理解为对严伯钧的“数字身体”进行“铸造”,而思想的克隆则可以比作“画心”。
“在硅基为我制作 AI 模型时,我几乎无需做过多特别的工作。”在严伯钧看来,他在严伯钓诞生之前并没有进行如外貌拍摄、3D 扫描、形象建模等复杂的准备工作,这个“铸体”过程其实相对简单。
严伯钧发布的短视频,其中包含“严伯钓”的创作
作为一名科普视频的创作者,严伯钧拥有丰富的视频和语音素材,这些成为了创造严伯钓的基础。当硅基智能利用这些素材生成严伯钓后,经过几轮与严伯钧的交流和调整,使其形象和声音更接近真实的严伯钧,数字分身的构建便顺利完成。
在思想克隆阶段,严伯钧早有准备。他提到,团队的 SOAN 技术擅长于“思想克隆”,早前已经通过约 100 万字的视频素材训练出了符合严伯钧风格的“文字皮肤”。在这一项目中,经过简单的完善后,AI 就能以“严伯钧风格”自动生成科普视频的讲稿。
具体来说,讲稿的生成过程大致可以分为以下几个步骤:首先,找到需要解析的素材如学术论文,并将其交给 AI 进行简单摘要;接着,让 AI 用通俗易懂的语言解释摘要中的专业术语,随后将其与解释部分结合,形成一篇易于理解的文章;最后,AI 再为文章添加严伯钧特有的“文字皮肤”,便可生成适合短视频制作的讲稿。
当严伯钓获得讲稿后,便能迅速生成一条看似由严伯钧亲自录制的科普短视频,团队工作人员只需进行简单剪辑和特效处理,便可在网上发布。
在严伯钧的一段短视频下,粉丝们讨论这是否为数字人所创作
最终愿景:
严伯钓将成为 24 小时“即问即答”的 APP
在人工智能大潮之下,许多创作者面临作品和风格被模仿的风险,甚至担忧会被 AI 取代,但严伯钧却选择将自己的作品交给 AI,让其模拟自己的形象、声音和思维。他对此并不感到担忧吗?
“当你意识到这是历史必然时,担忧就显得毫无意义,倒不如积极拥抱它。”严伯钧对 AI 持乐观态度,认为其发展是一种必然趋势,创作者们应当思考如何借助 AI 创作出更优质的作品,而非抗拒它。
在采访中,他提到选择将自身“全面 AI 化”的原因有两个:其一是希望将庞大的知识与个人风格结合,打破人脑的界限,为用户提供更好的科普内容;其二是希望突破博主的生命周期,让自己的优质作品得以传承和发展。
“我期待看到它比我更出色。它就像我的后代,继承了我的某些特质,但随着外部环境的变化,它应该会成为一个与我不同的存在。”严伯钧如此表示。
尽管目前“数字分身”仍被严伯钧称作严伯钓,但他已经为它规划好了一条进化之路:首先进行直播,接着发展为千人千面的严伯钓 APP。“这就像电影《她》中的场景,用户可以与它交流,它会像一个 24 小时在线的助手,随时回答问题,具备完全的自主意识,而现在的严伯钓相对静态,尚不能实时回应用户。”
那么,如何实现严伯钓的“静态”到“动态”的转变呢?严伯钧表示,不仅需要团队的技术支持,还需要用户与其不断互动,通过反馈和外部知识的结合,才能不断提升其能力。因此,团队正在考虑开发让严伯钓能与观众互动的直播功能。
此外,他透露,目前团队正在研发的另一个项目“txyz.ai”已与用户进行持续互动,它专注于学术论文和科研内容的 AI 对话网页,目前已收集到约 4000 万条学术相关问题,这些数据将有助于提升严伯钓的性能,助力其尽快开启直播功能。
电影《她》中主角与算法“女友”的对话
“严伯钓”的诞生是一个“水到渠成”的过程
司马华鹏在采访中表示:“我们本身在数字人和文本领域都有成熟的大模型,因此开发数字严伯钧是一个相对容易实现的目标。”当被问及在开发过程中遇到的技术难题时,他认为这实际上是一个水到渠成的过程。
他指出,2023 年上半年,中国的人工智能发展仍处于追赶阶段,但下半年情况发生了变化,“下半年,基于大量相关专有知识进行数据微调,并运用了高级检索增强生成技术(RAG),相关技术已经相对成熟。就像农民一样,到了时候,菜就熟了,可以上桌了。我们希望大家能够快速应用这些成熟的技术。”
然而在行业内,司马华鹏意识到,推动数字人领域的 AI 发展,不仅需要解决技术问题,改变公众认知也至关重要,“例如,关于数字永生,有多少人愿意将已故亲人‘克隆’出来?这需要极大的突破。”
与严伯钧的合作正是一个良好的技术应用契机。在项目启动前,硅基智能与严伯钧进行了几次会议,便决定联合其“思想克隆”技术,打造数字严伯钧。司马华鹏认为,严伯钧作为科普博主和人工智能从业者,对数字人有深入理解,其粉丝对新科技的接受度也较高。
“技术突破并非仅靠我们公司,背后还有大量研究论文的支持。新论文的启发结合我们的努力,使得(数字严伯钧的突破、迭代)可能在未来数月甚至数周内实现。”谈及数字严伯钧进化为“千人千面”APP 的时间,司马华鹏充满信心地表示:“从 2022 年到 2023 年,一旦跨越奇点,许多事情都在加速推进。”
数字人相关政策逐步构建与出台
未来可能提供更“人性化”的服务
据半岛都市报报道,在 2023 年 9 月举办的国际虚拟现实创新大会上,发布了《数字人行业发展报告》。报告指出,我国的数字人专项政策正在逐步构建与出台,同时已有多个地方推出了多项数字人相关政策,主要集中在元宇宙、虚拟现实、人工智能及数字经济建设等领域。
例如,2020 年 10 月,广电总局支持数字人在节目主持中的广泛应用,并发布了《广播电视和网络视听“十四五”科技发展规划》,明确鼓励和支持数字人的发展;2022 年 8 月,北京市出台国内首个数字人产业专项支持政策,发布了《北京市促进数字人产业创新发展行动计划(2022-2025 年)》;2023 年 1 月,重庆市元宇宙政策支持数字人产业基地建设,发布了《重庆市永川区元宇宙产业发展三年行动计划(2023-2025 年)》。
报告指出,我国数字人技术研究实力不断增强,数字人产业规模持续增长。在政策支持与技术革新的双重推动下,我国数字人产业展现出快速增长的趋势。综合上、中、下游产业规模,预计到 2023 年,数字人市场规模有望达到约 2500 亿元人民币,增长潜力巨大。
根据艾媒咨询最新发布的《2023 年中国 AI 数字人产业研究报告》,2022 年中国虚拟人核心市场规模为 120.8 亿元,同比增长 94.2%,预计到 2025 年将达到 480.6 亿元;2022 年虚拟人带动的周边市场规模为 1866.1 亿元,预计到 2025 年有望增至 6402.7 亿元。
2023 年,AI 数字人行业的主要客户集中在华东、华南地区的中小微企业,产品需求量前五的行业分别为电子商务、卫生、社会保障与福利、教育、金融和交通运输。互联网行业作为人工智能应用渗透率最高的领域,数字人产品在该行业的应用已相当广泛。
报告还指出,随着传统行业数字化转型及降本增效需求的增加,中国 AI 数字人业务需求将进一步释放,未来 AI 数字人将向着更具情感化和人性化的方向发展,为企业和个人提供更加贴近用户需求的服务。
未来,除了数字严伯钧 APP 可能会出现在科学爱好者的手机上,许多行业或许也会推出各自的数字人,以便在不同场景中提供更快速便捷且人性化的反馈与交流体验。
【如果您有新闻线索,欢迎向我们报料,一经采纳有费用酬谢。报料微信关注:ihxdsb,报料 QQ:3386405712】