共计 1361 个字符,预计需要花费 4 分钟才能阅读完成。
[视频内容] 本文包含视频内容
透明度
尽管“数字人”曾引发广泛关注,但其未来发展方向仍需探索和解答。
广州紫为云科技有限公司的创始人兼 CEO 顾友良表示:“我们已经将三维数字人的生成成本降至原来的千万分之一,期望每一个自然人都能以极低的费用拥有自己的‘数字人’。”
自创业之初,顾友良便致力于寻找三维数字人技术的实际应用路径。在这一过程中,他和团队经历了怎样的挑战,又如何描绘未来的“数字人”?在本期《路演记》中,让我们走进紫为云,探寻三维数字人的奇妙世界。
顾友良介绍道:“我们的核心技术只需一张照片,10 秒内即可将二维图像转化为超高清的三维数字人,相似度可达 90% 至 95%。”
在他看来,过去影视级的三维动画制作成本动辄数十万元,虽然效果卓越,但高昂的费用使得这一技术难以普及。因此,紫为云的策略是,在提升质量的同时,尽可能压低成本。
顾友良
他进一步强调:“我在创业之初就希望实现真人与虚拟人之间的真实交互,想要开发一种仅依靠二维人脸识别技术,通过生成和推理技术实现三维化的可能性。”
2024 年 1 月,紫为云团队推出了首代三维数字人产品。
他说:“我们曾将几代产品进行对比,差异显著,看到技术的不断进步让团队备感欣慰。”
随着技术的不断优化,紫为云在算力方面实现了轻量化,只需普通显卡便能完成数字人的制作。而生成成本的降低,使得紫为云有信心推出所有会员均可免费生成数字人。普通用户只需一部手机,便可轻松制作个人的“数字人”。
数字人效果。图 / 受访方提供
拥有数字人后可以实现哪些功能呢?
对此,顾友良指出,在每个人都可以拥有数字人之时,将会涌现出许多应用场景。
例如,用户可以通过手机投屏,创建一个虚拟空间,无论是沙漠还是海边,与亲友的数字人在此互动。如果结合虚拟世界和传感设备,甚至能够模拟真实世界的体验,达到虚实结合的效果。再加上 VR、MR 眼镜,更能提供沉浸式的第一人称体验。”
顾友良还提到,随着人工智能生成技术的进步,用户的想象可以转化为文字,再生成图片,最终形成三维的数字世界,融合人、物、场,展现空间智能的概念。如此一来,数字人便能够进入一个梦幻般的世界。
他补充道:“我们目前已经实现了一项功能,能够让数字人唱歌、跳舞、进行各种动作,只需 30 秒便可生成 MV。未来,音乐爱好者可借助数字人技术创作自己的 MV,甚至在虚拟环境中举办演唱会。”
更为重要的是,虚拟世界中的各种互动场景将积累大量数据。顾友良认为,这些数据的积累能够协助现有的人形机器人进行训练。
他说:“我们可以创建虚拟空间,生成机器人的数字人,让其在虚拟环境中与各种人进行互动,从而学习动作、沟通方式和语言等,并将获取的数据映射回现实中的机器人,这样可以大幅提升训练效率。”
谈及数字人技术的未来商业化落地,顾友良认为应从技术、产品和服务三个方面进行推进。
他说:“我们可以将核心技术开放给客户,协助他们满足特定场景需求;还可以将算法与硬件结合,提供技能培训等服务;此外,数字人产品也可以转化为服务,如内容创作、数字人智能体等。因此,数字人技术的潜力是无限的。”
文、海报、视频|记者 李钢