共计 1230 个字符,预计需要花费 4 分钟才能阅读完成。
[视频内容] 本文包含视频内容
近年来,“数字人”技术备受关注,但其未来发展方向尚待探讨。
广州紫为云科技有限公司的创始人及首席执行官顾友良表示:“我们已经将三维数字人的生成成本降低到了之前的千万分之一,希望每位用户都能以极低的成本拥有自己的‘数字人’。”
自创业之初,顾友良便致力于探索三维数字人技术的实际应用。在这一过程中,团队经历了诸多挑战,并对未来的“数字人”进行了深刻的思考。本期《路演记》将带您走进紫为云,领略“三维数字人”的魅力。
顾友良介绍道:“我们的核心技术仅需一张照片,约 10 秒钟便能将二维图像转化为超高清的三维数字人,并且与原图的相似度可达 90% 至 95%。”
他认为,以前影视行业的三维动画制作成本往往高达数十万元,虽然效果出色,但高昂的费用使得数字人技术难以普及。紫为云的目标是,在提升品质的同时,尽可能降低成本,让普通大众也能享受这一技术。
创业之初,顾友良的目标是实现虚拟人与真实人之间的高度交互。他希望是否能够依托二维人脸识别技术,通过生成与推理来实现三维化。
2024 年 1 月,紫为云团队正式推出了首款三维数字人产品。
顾友良回忆道:“我们曾将几代产品进行对比,技术进步显而易见,这让团队倍感欣慰。”
随着技术的进步,紫为云成功实现了算力的轻量化,普通显卡便可完成数字人制作,而生成成本的降低使得所有会员都能免费生成数字人。对于普通用户来说,仅需一部手机即可轻松创建自己的“数字人”。
那么,拥有数字人之后,我们可以做些什么呢?
对此,顾友良认为,随着每个人都能拥有自己的数字人,将会衍生出丰富的应用场景。
他举例说:“用户可以通过手机投影,创建一个虚拟空间,无论是沙漠还是海滨,都能与朋友的数字人进行互动。若结合虚拟世界与传感设备,更能模拟真实体验,达到虚实结合的效果。如果再配合 VR、MR 眼镜,将能够提供沉浸式的第一人称视角。”
顾友良进一步表示,伴随人工智能技术的演进,用户的想象力可以通过文字转化为图像,进而构建一个三维数字世界,融合人、物与空间,形成空间智能的概念。在这样的梦幻世界中,数字人将得以生存。
“我们目前已实现的功能包括让数字人唱歌、跳舞、展示各种动作,30 秒内即可生成音乐视频。未来,音乐爱好者将能够借助数字人技术创作自己的音乐视频,甚至在虚拟世界中举办演唱会。”
更值得注意的是,虚拟世界中的互动场景将积累大量数据。顾友良指出,这些数据积累甚至能帮助训练人形机器人。
他说:“通过创建虚拟空间,生成机器人的数字人,让其在虚拟世界中与人互动,从而学习动作、交流和语言等,最终将获取的数据映射回现实中的机器人,这将显著提升训练效率。”
对于数字人技术未来的商业化发展,顾友良认为应从技术、产品和服务三个方面入手。
他总结道:“我们能够将核心技术开放给客户,帮助他们满足特定需求,也可以将算法与硬件结合,为技能培训等提供服务,同时将数字人产品转变为服务,如内容创作和数字人智能体等。因此,数字人技术的潜力巨大。”
文、海报、视频|记者 李钢
编辑:潘海辉