共计 506 个字符,预计需要花费 2 分钟才能阅读完成。
快手推出可灵 AI 数字人功能,支持一分钟视频生成
新京报贝壳财经的记者韦英姿报道,快手于 9 月 18 日宣布,其可灵 AI 新近推出了数字人功能,能够生成最长达 1 分钟的视频。目前该产品正在进行公测,逐步向用户开放。快手方面指出,通过交叉注意力机制实现音画的高效对齐,结合强化口型训练策略和精细化数据处理技术,数字人能够有效地保证语音与唇形的同步。此外,基于关键帧控制架构,模型首先构建高层叙事框架,然后并行生成多个片段的视频,确保在保持身份一致性的前提下,生成一定长度的视频内容。
可灵 AI 数字人功能展示页面。图源:企业提供
贝壳财经的记者对可灵 AI 的对口型功能进行了测试,分别使用了中文、英文和韩文歌曲。在一段 8 秒的视频中,发现该功能对中文歌曲的识别效果优于英文和韩文,后者在某些单词与数字人唇形的匹配上仍存在一定困难。
编辑 杨娟娟
校对 柳宝庆
来源:今日头条
原文标题: 可灵 AI 推出数字人功能,最长支持 1 分钟视频生成 – 今日头条
声明:
文章来自网络收集后经过 ai 改写发布,如不小心侵犯了您的权益,请联系本站删除,给您带来困扰,深表歉意!
正文完