“数字人”崛起,未来市场潜力无限!

共计 3256 个字符,预计需要花费 9 分钟才能阅读完成。

本报记者 陈子帅 杨沙沙 本报驻美国特约记者 冯亚仁 ●宋 毅

编者寄语:在今年的“双 11”购物节,各大电商平台纷纷推出了虚拟“数字人”主播。这些数字人不仅能够高度模拟真人的表情与动作,还具备 24 小时不间断直播、流畅解答消费者问题及推荐团购等多种功能。据统计,中国目前拥有接近 1.4 亿个视频主播账号,其中虚拟“数字人”占比达到 40%,超 5000 万个。那么,这些“数字人”是如何生成的?它们还有哪些潜在的应用场景?未来又可能面临怎样的机遇与挑战?《环球时报》记者对此进行了深入调查。

仅需半小时,一个“数字人”便能诞生!

“数字人”,即“2D 真人孪生数字人”,是指通过计算机技术创造出类似真实人物的虚拟形象。京东云言犀数字人产品的负责人在接受《环球时报》记者采访时,分享了如何利用大模型等人工智能技术,从零开始打造一个“数字人”的过程。

简单来说,构建一个“数字人”需要经过三个步骤。首先是“人像视频拍摄”。只需收集真人主播的外貌、声音等音视频数据,通常在录影棚拍摄 1 至 2 个小时的带货视频即可。然而,随着大模型技术的发展,现在只需 3 到 5 分钟的录像便可完成。

第二步是“形象声音模型训练”。这包括音视频预处理、自动数据标注、3D 人脸重建和口唇驱动训练等。简而言之,将这 3 到 5 分钟的视频输入京东云自研的“数字人自助克隆工具”,在 24 小时内便可生成一个“数字人”。

“我们甚至可以更快,比如针对主播带货的状态进行数据采集,半小时内就能生成一个用于直播的‘数字人’。”该负责人透露,京东云目前为约 4000 个品牌提供“数字人”服务。以直播“数字人”为例,定制形象的费用大约在几万元,也有快速、轻量化的批量定制形象,成本不到一万元。两者之间的区别在于,前者的“数字人”可以根据客户需求定制口唇匹配和神态表现,而后者则更具性价比,成本更低。

第三步是将“数字人”应用于不同场景。今年 9 月,新浪微博上线了一段视频,展示了人工智能学者高庆一的“数字人”与京东嘉宾的“数字人”进行对话的场景。视频中,高庆一的“数字人”在走动、手势、表情以及与京东“数字人”嘉宾的互动方面几乎可以模拟真实人类,但依然存在一些差距。“从技术制作的角度来看,行业内的竞争在于如何以更快的速度和更低的成本复制和克隆‘数字人’。”该负责人表示,许多“数字人”在表情上较为呆板,姿态固定,如何实现丰富的姿态变化,例如侧脸、走动、手势等,仍然是技术上的一个难点。

从目前情况来看,“数字人”的成本极具吸引力。负责人士介绍,言犀虚拟主播的成本不足真人的 1 /10,除了需要一台电脑和一个运营人员之外,几乎无需其他投入。举个例子,一家国产化妆品牌借助基于大模型的自动生成直播文案,2 至 3 小时内便可完成直播间剧本的搭建,而人工编写直播剧本则可能需要两三天。数据显示,使用“数字人”接力直播后,直播间的月销量增加了三倍。

推动“数字人”应用落地的多方力量

在今年的杭州亚运会开幕式上,观众们对参与点火的“数字火炬手”印象深刻。随着人工智能技术的不断进步,这类“数字人”正越来越多地融入人们的日常生活中,在电商带货、在线直播、新闻播报等多个领域大显身手。

中国人工智能企业科大讯飞的虚拟人平台总经理郜静文近日表示,科大讯飞的虚拟数字人应用已经覆盖媒体、教育、金融、文化旅游、政务等领域,虚拟人可以扮演虚拟主播、老师、客服、导游、政务办事员等多种角色。

郜静文指出,“数字人”的成本主要包括构建成本、技术服务费用及自主运营成本。随着技术的迭代和应用场景的更新,各部分成本也在不断降低。例如,以前构建 2D 真人虚拟人需要 30 分钟的数据,现在仅需 3 分钟甚至 30 秒即可完成,“这项技术的迅速发展,正是现实场景需求对技术的巨大推动。”

在日本,“数字人”同样非常受欢迎,多个行业开始运用虚拟数字人进行服务接待。据朝日电视网报道,日本电报电话公司首次使用虚拟数字人作为接待员。这个“数字人”是由 9 名真实员工和其他面孔合成而成,声音和动作皆由 AI 技术驱动。据悉,这是日本首个真人大小的“数字人”,除了用于前台接待外,还将应用于商务客服等多种场合。

美国的科技公司通过打造虚拟网红来帮助企业吸引客户。统计数据显示,2022 年约 35% 的美国消费者购买了“数字人”推广的产品,其中千禧一代和 Z 世代的消费者占比达到 40%。据 Territory Influence 的报告,目前虚拟网红市场的价值已达 46 亿美元,预计到 2025 年将增长 26%。

根据艾媒咨询发布的《2023 年中国虚拟人产业发展与商业趋势研究报告》,2022 年中国虚拟人带动的产业市场规模和核心市场规模分别为 1866.1 亿元和 120.8 亿元,预计到 2025 年将达到 6402.7 亿元和 480.6 亿元。

目前,“数字人”最常见的应用场景是在电商直播领域。京东云言犀数字人产品负责人向《环球时报》记者表示,未来“数字人”的应用场景将非常广泛,金融机构、机场、政务部门等都有需求,能够充当线下业务的银行业务员、机场导游等。

随着人工智能技术的不断迭代,该负责人表示,“数字人”的表现将愈加真实,不仅在外观上,甚至在语言风格、处理事务的方式上,都会赋予“数字人”更多智能,使其在服务类场景中迅速落地,满足各类企业和机构的需求。

关于“数字人”的未来应用,外经济贸易大学国际关系学院的学者梁怀新指出,“数字人”在电商直播等领域已经得到了充分应用,但在类人化表现和交互感受等方面仍有很大的提升空间。随着这些技术问题的解决,“数字人”的应用场景将进一步扩展,包括数字偶像、数字医疗、数字谈判、数字娱乐等领域,可能会创造出大型 IP 娱乐明星、类人化医学专家、谈判助手和全息游戏等新应用。

需重视的风险问题

伴随“数字人”在越来越多场景的应用,其潜在风险和监管问题也日益凸显。对外经济贸易大学的学者梁怀新告诉《环球时报》记者,首先,“数字人”在设计时需要采集仿生对象的个人数据,若存储不当,容易导致隐私泄露,可能导致冒用个人声音、肖像进行诈骗;其次,“数字人”的普遍使用可能对劳动市场造成冲击,取代大量人类工作岗位,带来失业的风险;此外,“数字人”的安全问题还可能导致社交方式变得虚拟化,社会资本过度集中于数字领域。

在制作“数字人”之前,京东方面表示将与出镜人员签订含肖像权的授权协议。在采集“数字人”对应真人的肖像和声音数据前,京东云言犀数字人产品的负责人也表示,必须与真人主播签署相关法律授权协议,明确肖像使用的场景和范围。在数据安全方面,京东平台和算法也需在国家工信部进行备案。此外,相关部门还要求对虚拟形象的使用进行加密,以确保无论投放在哪个场合,都能做到可追踪,保障“数字人”的安全性。

在虚拟数字人的安全应用方面,监管部门和行业都非常重视,涉及版权授权、技术认证、内容安全以及展示鉴别等多方面的规范。科大讯飞虚拟人平台的总经理郜静文向《环球时报》记者表示,虚拟“数字人”的构建必须获得版权人的同意,技术公司的生成技术须经过相关单位的认证,应用方与平台方要对内容安全进行审核和监管,用户在获得虚拟数字人时应有明显或隐形的信息告知。

为了规范“数字人”及相关产业,我国目前已颁布了《生成式人工智能服务管理暂行办法》等一系列规章。2022 年 11 月 25 日,国家网信办、工信部和公安部联合发布《互联网信息服务深度合成管理规定》,旨在加强对互联网信息服务深度合成的管理。《规定》指出,深度合成服务技术提供者需履行备案和变更、注销备案的手续。

梁怀新指出,未来针对“数字人”在著作权、肖像权、数据隐私及平台监管等方面存在的问题,可以采取“综专结合”的思路,首先在行业内制定专门应对“数字人”具体安全隐患的行政规章,并力争尽快出台国家层面的综合监管法规。▲

来源:今日头条
原文标题:“数字人”刷屏,市场前景可期 – 今日头条
声明:
文章来自网络收集后经过 ai 改写发布,如不小心侵犯了您的权益,请联系本站删除,给您带来困扰,深表歉意!
正文完
 0
小智
版权声明:本站原创文章,由 小智 于2025-10-16发表,共计3256字。
转载说明:除特殊说明外本站文章皆由CC-4.0协议发布,转载请注明出处。
使用智语AI写作智能工具,您将体验到ChatGPT中文版的强大功能。无论是撰写专业文章,还是创作引人入胜的故事,AI助手都能为您提供丰富的素材和创意,激发您的写作灵感。您只需输入几个关键词或主题,AI便会迅速为您生成相关内容,让您在短时间内完成写作任务。
利用AI智能写作工具,轻松生成高质量内容。无论是文章、博客还是创意写作,我们的免费 AI 助手都能帮助你提升写作效率,激发灵感。来智语AI体验 ChatGPT中文版,开启你的智能写作之旅!
利用智语AI写作工具,轻松生成高质量内容。无论是文章、博客还是创意写作,我们的免费 AI 助手都能帮助你提升写作效ai率,激发灵感。来智语AI体验ChatGPT中文版,开启你的智能ai写作之旅!