共计 1354 个字符,预计需要花费 4 分钟才能阅读完成。
在为期三天的 2022 中国 5G+ 工业互联网大会上,数字人技术成为了极为引人注目的焦点。这些数字人不仅能够交流、演唱和跳舞,甚至具备理解和思考的能力,逐渐成为了人们日常生活和工作的得力助手。

中国电信展台展示的智能仿真机器人“小翼”
“您好,欢迎来到中国电信展台!”
在中国电信的展区内,智能仿真机器人小翼引起了观众的极大关注。她长发飘逸,肤色白皙,能够与人进行自然对话,有时还会俏皮地眨眼,成为了展会的“明星”。
湖北电信政企信息服务事业部赋能部主任胡旭表示:“小翼”不仅是智能客服,还担任展厅的接待和讲解角色。未来,她将以虚拟数字人的身份出现在元宇宙中。“在营业厅中,她可以处理取号和咨询等事务。我们计划在虚拟展厅方面进行探索,打造出能够在数字森林中进行互动的小翼机器人,用户只需佩戴 VR 眼镜便可体验。”

科大讯飞的虚拟主播“爱加”展示
在科大讯飞的展台上,工作人员张依雯介绍,讯飞打造的多位虚拟主播已在冬奥会等多个场合亮相。记者注意到,电子屏幕上,虚拟主播“爱加”正在与观众进行交流,面部表情和口型与语言内容高度同步。
“我们的虚拟人物可以与真实主播进行互动。目前,实现了一次唤醒后多轮交互的功能,用户只需首次呼唤,后续可以持续提问。这是我们在底层语音交互方面的创新,称之为全双工语音交互,所用的技术均为科大讯飞自主研发的芯片。”

舞台上,虚拟人“盈盈”与机器人一起准备歌舞表演
在讯飞隔壁的元宇宙大舞台上,屏幕上的虚拟人“盈盈”正与现场的机器人一起随音乐舞动。盈乾家智能科技(武汉)有限公司的执行总经理袁赫表示,未来,虚拟人“盈盈”将通过云端“大脑”与机器人实现深度结合。
“通过云端大脑,我们可以将他们的记忆和指令进行连接。目标是实现超高仿真的机器人,她将具备高智能化,可以进行日常对话,也能承担家政、照顾老人的任务。”
随着“元宇宙”概念的兴起,各行各业都在积极开发虚拟人形象。在展会现场,武汉人工智能研究院展示的虚拟人“小初”基于“紫东太初”大模型,具备视频生成、描述、图像生成、智能问答及语音识别等多种功能,甚至在纺织生产线上能够通过声音识别纱线断头的质量缺陷。

武汉人工智能研究院创投中心总监刘昊
“紫东太初”是全球首个拥有千亿参数的三模态大模型,成功实现了图像、文本与语音数据的“统一表示”和“相互生成”,使人工智能从单一能力向多种能力发展。武汉人工智能研究院创投中心总监刘昊表示:“人脑的参数级别可达百万亿,虽然‘紫东太初’的千亿参数与此仍有差距,但已经解决了从单模态到三模态的融合问题。后续的训练是否达到万亿或十万亿参数,将取决于时间和计算能力的配合。”
刘昊提到,目前“紫东太初”大模型的应用已覆盖 40 多个领域,包括智慧城市、智能制造和智慧医疗等,涉及颅内手术机器人、手语考核机器人、验布机器人等多个项目。“我们有个概念是将大模型‘蒸馏’成小应用。未来,我们将推出‘紫东太初’人工智能开放服务平台,构建一个‘低代码、一站式’的人工智能平台,助力更多中小企业提升人工智能应用,增强行业效率。”
湖北之声记者:夏晓青、杨晓
通讯员:许国胜、涂兴佩、李萱庭