共计 3196 个字符,预计需要花费 8 分钟才能阅读完成。

在 2016 年 7 月 23 日,上海,一位名叫洛天依的全息虚拟偶像在二次元演唱会中为到场的粉丝献唱。本文所用图片均来源于视觉中国。
你是否听说过洛天依和《甩葱舞》呢?伴随着虚拟偶像的崛起,虚拟人行业已成为资本投资的新热点。
根据公开数据显示,截至今年 9 月,国内虚拟数字人领域的融资总额已超过去年,达到了 24.9 亿元。2021 年,相关企业的融资额约为 19.71 亿元,而在 2015 年这一数字仅为 0.33 亿元,六年间的复合增长率高达 97.71%。
各大科技公司纷纷在虚拟人领域展现实力,国际巨头如 Meta、微软,以及国内的腾讯、阿里、百度、快手和网易等,都在这一领域投入巨资。
除了虚拟偶像,虚拟人在多个场景中已实现了实际应用。“虚拟人的价值并不仅限于‘不塌房’的偶像形象。”顺为资本副总裁冯铮在接受澎湃新闻采访时表示。“虚拟人的主要应用场景是虚拟身份和交互界面:前者是虚拟世界中的个人形象,后者则是由人工智能驱动的虚拟机器人,能够与人类进行互动。”
在 2022 年 10 月 10 日,武汉,首个裸眼 3D 数字虚拟人——“祁小蓦”首次亮相,吸引了众多市民前来拍照留念。
元宇宙市场如同创立初期的门户网站
从学术角度看,虚拟人是指通过 CG、动作捕捉、VR 等技术,以图像、视频、直播等形式存在于非物理空间中的拟人化形象,通常被称为数字人。
Unity 中国的技术总监杨栋向澎湃新闻表示,虚拟人技术已经发展了一段时间。今年之所以受到瞩目,一方面是因为柳夜熙、洛天依等娱乐虚拟形象的热度,另一方面是“元宇宙”概念的兴起。个人定制虚拟形象的需求持续增长,使得虚拟人行业逐渐进入大众视野。
冯铮指出,“虚拟人最早在 2017 年引起关注,随后经历了一段摸索期,近两年逐渐进入商业化阶段。”他进一步表示,“元宇宙概念较为抽象,而虚拟数字人作为最直观和具体的形式,因而更容易吸引资本的眼球。”
艾媒咨询的预测显示,虚拟人推动下的国内市场规模预计将在 2025 年达到 6402.7 亿元。
虚拟人究竟是如何制作的呢?网易伏羲虚拟交互技术的负责人斋藤飞向记者介绍,制作一个虚拟人需要考虑场景、受众、承载虚拟人的硬件平台及成本等多方面因素,这些条件共同决定了虚拟人的风格与美术标准,并在此基础上进一步定义角色名称、设定及主视觉设计。
他还提到,虚拟人制作仍是一个复杂的技术体系,涉及美术(建模师、绑定师、动画师)、开发(客户端开发、技术美术、视效开发)及算法(语音生成、动画驱动)等多个学科、领域和职能的协同合作。不同领域的团队在共同目标下高效管理也成为一大挑战。
目前,虚拟人可分为多种类型,最为人所知的是娱乐型虚拟人,例如柳夜熙、AYAYI、洛天依等,这些虚拟偶像活跃于社交平台,有时也会进行带货。第二类是服务型数字人,即虚拟员工,另外还有一些虚拟数字人用作客服。第三类是 ID 型数字人,代表虚拟世界中的某个特定角色,比如虚拟新闻主播等。
冯铮预计,实现虚拟人的商业价值最大化可能需要五到十年。他认为,只有当所有人都拥有下一代硬件设备时,才能像移动互联网那样对世界产生大规模影响,释放产业的最大潜力。
他还指出,目前虚拟人领域的企业竞争并不激烈。“大多数企业更关注短期盈利,而虚拟人目前的商业回报尚不明显,更多的是长远布局。”
作为投资者,冯铮坦言,他特别关注初创企业的技术能力及短期切入点。“现阶段的元宇宙与 1998、1999 年的互联网相似,当时四大门户网站和阿里巴巴刚刚成立。如今在虚拟世界中,有一批有愿景的创业者开始探索,并吸引了一些早期用户。在行业迭代中,产品将随着认知、技术、用户及硬件的变化不断进化,这些都考验着企业的核心技术能力。”
在 2021 年 7 月 8 日,上海,AI 数字虚拟人在 WAIC 世界人工智能大会上展现风采,微软小冰与 D7 少年团的《明日之子》学员贺俊雄同台“对唱”。
巨头争相布局,谁将领先
虚拟人已经成为众多科技巨头共同关注的领域。
文娱产业分析师张书乐认为,虚拟人在某种程度上是互联网大厂展示实力的体现,集中展示了内容创作、人工智能、动作捕捉及相关技术的融合。
腾讯智能产品副总裁李学朝表示,腾讯通过整合 ASR(语音识别)、NLP(自然语言处理)、语音交互、自然语言理解、图像识别、TTS(语音合成)、知识图谱等 AI 能力,连接腾讯的内容和服务生态,提升平台能力,助力客户打造智能、形象且可互动的数字分身。
李学朝强调:“数字人是互联网 3.0 的重要入口,不仅是技术效率的解放,还将推动线上与线下的全面整合,迈入全真互联。”
网易伏羲事业部在 2018 年便成立了虚拟人团队,网易伏羲 AI 虚拟人首席专家大丁透露,当时团队成员是国内最早的虚拟人制造师之一。
如今,虚拟人制造师的职位愈发抢手,涉及的不仅有 AI 从业者,还包括工程师、技术美术、产品经理以及项目管理和商务等岗位。
百度在 2019 年正式进入数字人领域,主打高度定制化的超写实机器人。百度数字人与机器人业务负责人李士岩表示,虚拟人是技术驱动型市场,一旦某个技术取得突破,市场将迅速扩展。“预计到 2030 年市场规模将达到 2700 亿,2022 年市场产值已达到数十亿,并且预计每年增速超过 50%。”
在他看来,虚拟人是 web3.0 和元宇宙时代的主流内容载体与交互方式。“我们非常看重虚拟人未来的应用场景及其在营销与生产中的价值,未来虚拟人将成为每个人在元宇宙中的载体和分身,百度将坚定投入人力与资金,每年以百分之几十的速度增长。”
快手也宣布了在虚拟人方面的最新进展。快手 Y -tech AI 技术中心负责人万鹏飞告诉澎湃新闻,“目前快手可以提供从建模到最终内容制作的一站式服务,在全链路上都有深厚的积累。”他还透露,数字人和 XR(扩展现实)是快手的发展重点。
在 10 月 12 日,Meta 发布了最新的数字人成果:通过手机扫描即可生成超写实数字化身。根据扎克伯格在发布会上的介绍,Meta 的新扫描技术可以在任何正常光源下自主扫描,突破了数字人扫描中的空间限制。此外,Meta 的科研团队表示,他们仍在致力于缩短处理时间,以进一步提高扫描效率。
在 2022 年 10 月 11 日,美国纽约,Meta 首席执行官马克·扎克伯格在虚拟 Meta Connect 活动上发表讲话。
制作成本高昂,实时交互存在挑战
杨栋透露,虚拟人的制作成本极高,从前期的动作和表情捕捉,到后期的数据处理与渲染,涉及的时间与人力成本都非常可观。
他认为,降低成本的关键在于建立标准化的制作流程,并在每个环节提供专业化、标准化的工具和解决方案,以促进整个行业的加速发展。
杨栋指出,虚拟人真正的挑战在于实时交互。目前,大多数偏写实或 3D 的虚拟人展现方式仍主要为视频类型。如果要实现实时交互,不仅需要依赖画面,还需语音、智能系统、硬件设备、网络以及算力等系统的配合。产业发展仍需时日,但市场需求已然显现。
万鹏飞也同样强调了实时交互的重要性与困难。“用户需要与环境及他人进行交互的能力。”他认为,虚拟世界的构建核心在于社交关系,而这类关系需要身份系统、环境系统及经济系统等共同构成,这在技术上仍然面临不少挑战。
尽管虚拟人受到了业内和资本市场的普遍关注,但目前的发展仍处于早期阶段。张书乐分析指出,目前虚拟人内容的输出依然依赖人工完成,涉及声音库生成的内容创作与动作捕捉,远不如与现实艺人的演出简单。
此外,尽管人工智能驱动的虚拟数字人可以进行有效的问答及特定内容创作,但当涉及到认知盲点时便失去效用。例如,在驾驶中作为车载导航的虚拟人进行人机交互,其意义与智能音箱并无二致,形象展现也没有实际价值。
“若只看到营销成本的降低,却忽视虚拟数字人研发、维护与升级的成本,便是对虚拟人作为低成本营销工具的一种偏见。”张书乐表示。
网易伏羲的产品经理阁语透露,未来技术团队的发展将分为两方面:一是致力于创造更生动自然的虚拟人,使其表现更接近真人;二是实现虚拟人生产及 AI 能力应用的规模化,将虚拟人技术高效地应用于各个场景。