共计 2213 个字符,预计需要花费 6 分钟才能阅读完成。

目前数字人在语义理解和情感互动方面仍无法与人类相提并论。
受到虚拟现实与元宇宙等新兴概念的推动,以虚拟偶像、主播及员工为代表的数字人,正在迅速成为市场的焦点。随着政策的扶持,数字人成为众多大型企业争相投入的人工智能领域。然而,技术、产品和市场等多重因素使得这一领域面临诸多瓶颈与挑战。如今“外表华丽却缺乏灵魂”的状况,意味着数字人产业在实现商业价值的道路上还有很长的探索之旅。■新快报记者 梁茹欣
政策助力加快产业发展
借助逼真的外观,数字人正在逐步从影视、文学等领域拓展到文娱传媒、金融、教育等多个行业。那么,数字人究竟是什么呢?根据业内普遍认可的定义,数字人是利用计算机图形技术(CG)、图形渲染和语音合成等技术生成的虚拟人物。这些角色通常具备与人类相似的外形、互动感知能力及表达能力。根据应用类型,数字人可以分为两大类:一是以服务为主的功能型数字人,如虚拟员工、教师和导游;二是以娱乐、社交及个性化表达为主的身份型数字人,例如虚拟偶像。
根据清华大学发布的《元宇宙发展研究报告 3.0 版》,2021 年虚拟数字人核心产业的市场规模约为 336 亿元,年均增长率为 31%,预计到 2025 年将达到 998 亿元。到 2022 年 10 月,虚拟数字人领域的融资案例接近百起,融资总额约为 120 亿元。此外,市场调研机构 IDC 的数据显示,预计到 2026 年,中国的 AI 数字人市场规模将达到 102.4 亿元,市场将持续快速增长。
今年以来,借助政策的东风,数字人产业迅速驶入快车道。今年 11 月,工业和信息化部等五个部门联合发布《虚拟现实与行业应用融合发展行动计划(2022-2026 年)》,明确提出到 2026 年,三维化及虚实融合的沉浸影音技术需重点突破,并实现虚拟现实在重要行业的规模化应用。
在各地,数字人相关产业成为多个地方产业布局的重要组成部分。7 月,北京市发布了《北京市促进数字人产业创新发展行动计划(2022-2025 年)》,目标到 2025 年,实现数字人产业规模突破 500 亿元,培育 1 - 2 家年收入超过 50 亿元的头部企业,以及 10 家年收入超 10 亿元的重点企业和 20 个标杆项目几乎同期,上海也发布了《上海市数字经济发展“十四五”规划》,强调发展人机交互技术,加速智能人机交互及虚拟数字人的技术攻关,推动数字娱乐消费的新业态。
数字人制作成本显著降低
行业分析人士指出,经过一段时间的市场培育,越来越多的企业开始探索可落地的应用场景,预计国内虚拟人将在特定服务领域(如直播带货、虚拟客服等)实现规模化应用。IDC 中国助理研究总监卢言霞表示,现阶段 AI 数字人在某些领域已展现出显著的商业价值。未来,数字人将与人类生活和工作大规模共存。然而,在引入 AI 数字人时,行业用户应保持耐心,不应对应用场景抱有过高期望。
实际上,由于在快速生成和 AI 驱动等方面存在技术瓶颈,数字人目前难以实现低成本、高频次的内容生产。这也意味着,高质量虚拟数字人制作的成本相对较高。根据洞见研报《2022 年虚拟人行业研究报告》,虚拟人的制作成本通常在百万元以上,更高精度的甚至可达千万级别。这些费用大多用于建模、AI、动捕和渲染等技术的投入。以 2021 年底走红的抖音美妆达人“柳夜熙”为例,其制作团队曾透露,制作成本约在百万级别。
游戏引擎商 Cocos 的相关负责人向新快报记者表示,业内定制数字人根据美术风格可分为卡通、二次元和写实等,数字人的定制价格从千元到百万元不等。通常千元级别的数字人多用于电商 24 小时直播机器人,这类技术要求较低,用户通过选择预设的卡通形象进行直播。而百万级别的数字人,如“柳夜熙”和“AYAYI”等,涉及到基本人设的策划,需根据客户需求进行内容创作。目前超写实虚拟人多以视频或图片形式展现,制作流程偏向 CG 生产逻辑,一次短视频内容的制作成本在几十万左右。
业内人士认为,随着 AI 算法的不断突破,数字人的制作成本和周期将大幅缩减,从过去需要一年半的制作时间,缩短至两三个月甚至数小时内即可交付,制作成本也将从原来的百万级降至万元级别。
数字人何时能拥有“有趣的灵魂”?
尽管当前许多数字人企业声称已实现“降本增效”,但更多体现在营销成本的降低。即便是在相对成熟的直播带货场景中,数字人由于成本因素仍难以与真人主播形成明显优势。目前,数字人产业整体尚未盈利,制作与运营维护成本高、变现能力不足等问题仍制约其发展。此外,市面上大多数数字人仍停留在外形逼真的阶段,能够灵活展现表情、动作,以及根据声音或文字做出标准口型等,但在语义理解和情感互动方面与真人存在明显差距,实际上只有华丽的外表而缺乏“灵魂”。
数字人距离拥有“有趣的灵魂”还有多远?Cocos 品牌相关负责人表示,数字人未来的发展应更多地融入类似 ChatGPT 的对话模型,使对话内容更加丰富和有趣。同时,还要灵活地将人类的互动逻辑引入数字人之中,这需要大量的手势交互、动作捕捉等技术的沉淀和积累。“我相信到 2023 年底,我们将看到大量类似逻辑的产品问世。未来,数字人将不再是专业供应商定制的专属,而是由个人创造和生成,让数字人在虚实结合空间中进行互动。”