共计 2555 个字符,预计需要花费 7 分钟才能阅读完成。
本报记者 叶 子
在福建省福州市长乐区的数字教育小镇网龙基地,市民们正在体验数字人直播项目。王旺旺摄(人民视觉)
在 2024 年 7 月,工作人员在全球数字经济大会的沉浸式体验区与数字人进行互动。新华社记者 任 超摄
春节期间,浙江省杭州文化广播电视集团的《杭州新闻联播》节目引入了 AI 数字人进行新闻播报,且实现了零失误,受到了广泛关注。
所谓数字人,指的是基于数字技术创建的、模拟人类特征并存在于虚拟世界的角色。近年来,随着 5G、人工智能、虚拟现实等新一代信息技术的迅猛发展,数字人的精细度和智能化程度持续提升,越来越多的数字人开始融入日常生活的各个领域。
借助大模型,使其变得更“聪明”
据悉,《杭州新闻联播》已启用 6 位数字人主播,这些主播都具备近似真人的外观和栩栩如生的表情动作。经过画面采集、声音录制和算法训练后,这些数字人主播能够在直播中精准播报新闻,因此出现了新闻主播回家过年、由 AI 主播替班的现象。
通常,数字人是通过数字建模技术实现的,涉及计算机图形学、动作捕捉、图形渲染、语音合成、深度学习等多种技术。杭州电视台的新闻主播雨辰表示,她的数字分身“小雨”首次接入了 DeepSeek-V3,因而相比以前,“小雨”变得更加“聪明”,不仅能够理解人类语言、播报新闻,还能进行文稿审核和新闻材料整合。
实际上,数字人主播并不是第一次面对观众。
去年的春节,中阿卫视中国新闻中心便已使用数字人主播。在编辑机前,中阿卫视的编辑通过简单操作,让数字人主播“毕诺 -D”完成了一条新闻的播报,并以阿拉伯语发声。中阿卫视的相关负责人表示,使用数字人之后,制作一条两三分钟的新闻播报,前后只需二三十分钟,而不用重新录制,显著提高了工作效率。
业内人士指出,以前电视台主要把数字人主播应用于网络和新媒体,现在这种形式逐渐进入日常播报的常态化。数字人主播在广电媒体领域的广泛应用,主要得益于其言行举止可以事先设定和调整,提高了可控性;同时,数字人能够轻松改变外观特征,避免了化妆、场地等额外开支,有助于节目的创新。此外,数字人也能快速生成播报视频,帮助新闻机构抓住时效性。
中国互联网协会专家咨询委员会成员、网络文化与数字传媒工委会主任武锁宁在采访中表示,近年来,AI 和数字人技术逐渐成为推动传媒行业变革的关键力量,正在重塑内容生产模式,提供一种“人机双轨制”的新型合作模式,即 AI 负责简单的标准化内容处理,如天气预报、新闻快讯等;而人类则专注于更复杂的创造性工作,例如深度报道和新闻评论。他指出,未来,随着大模型在逻辑推理和自主决策等方面的提升,数字人将赋予新闻内容更强的互动性和个性化,推动人机交互进入全新阶段,从而实现更灵活、高效的内容生产与传播。
电商直播间,轻松“一键开播”
除了在电视节目中展现风采,数字人还在线上直播间提供服务。
“欢迎各位朋友来到我们的直播间,我们是……”除夕当天,在某饮料品牌的直播间里,主播熟练地进行了开场白。实际上,这位主播是基于该品牌负责人形象所制作的数字人。
为何尝试数字人直播?该品牌表示,在春节假期期间,优质真人主播短缺且合作成本昂贵,因此决定试水热门的数字人直播。通过之前品牌负责人直播的录屏,他们打造出一个高度拟真的数字形象,并选用了适合该形象的音色,提前完成了制作。
在“春节不打烊”的直播间里,数字人主播具备实时智能问答的能力,能够有效促进互动并提升销售氛围。数据显示,春节期间,该饮料品牌的数字人直播中,转化率(CVR)提升了 50% 以上。
国家发展改革委等部门发布的《关于打造消费新场景培育消费新增长点的措施》提出,在明确标识和规范监管的基础上,探索利用人工智能大模型、虚拟现实全景和数字人等技术,拓展电商直播场景。记者了解到,电商直播行业中,真人主播成本较高,长时间直播容易疲惫,因此存在工作时长限制。而数字人主播可以全天候在线,通过 AI 生成直播脚本,轻松实现“一键开播”,可谓是“低投入、高产出、持续时间长”,因此受到许多商家的青睐。
据百度 AI 全栈式数字人直播解决方案慧播星的负责人介绍,技术上只需一段 3 -40 分钟的真人直播片段,即可生成相应的数字人形象,配置好脚本和互动问答后,数字人主播便能高效开播,实现声音与口型的完美匹配,口播准确,动作流畅自然。在脚本方面,大模型可以根据指令一键生成全文,或对输入文本进行仿写、扩写、精简和润色;在智能互动方面,数字人能够回答直播间用户的问题,并根据需求讲解商品,轻松应对领券、促单、邀请评论、调度展示商品细节等环节。
业内人士分析,数字人直播带货在创意创新和成本控制方面具有优势。与真人主播团队在培训、薪资等方面的支出相比,数字人直播只需一台电脑和一名运营人员,能显著降低成本。然而,一些用户反馈,当前部分直播间的数字主播缺乏灵活性,有时只能套用 AI 模板,无法提供满意的解决方案。相比于真人主播在交流中处理复杂信息的能力,数字人主播在技术支持上仍需不断完善和升级。
商业前景广阔,但需警惕风险
AI 的广泛应用显著提升了数字人的交互能力、内容生成能力和智能化水平。目前,虚拟偶像、虚拟主播和数字员工已成为数字人中最具商业化应用前景和人气的类别。根据 2024 首届中国数字人大会发布的《中国数字人发展报告 (2024)》,预计到 2025 年,中国数字人核心市场规模将达到 480.6 亿元,推动产业市场规模达到 6402.7 亿元。
AI 在处理大量数据和执行重复性任务方面表现突出,且遵循算法和程序,能够减少人为错误,显著提升效率。然而,隐私保护、数据安全、伦理问题等仍然是未来数字人发展中必须关注的风险。
武锁宁表示,数字人技术的广泛应用还需建立数字形象授权认证体系、完善 AI 内容溯源机制,并构建人机协作的伦理框架。“我们正在推动数字人应用标准的制定,推进数字人术语、管理、服务等基础共性标准,以及数字身份多模态交互等关键技术标准,以及数字客服、数字员工等重点领域服务标准的研究与应用,以建立完善的数字人标准体系。”武锁宁指出。