可灵AI推出全新数字人功能 – 今日头条

共计 1850 个字符,预计需要花费 5 分钟才能阅读完成。

近日,可灵 AI 数字人正式亮相,凭借领先的口型精准度、情绪动作演绎和跨风格泛化能力,重新定义了数字人技术的行业标准。用户仅需上传一张角色图片、输入角色表达内容或一段音频,就能生成最长 1 分钟、极具表现力的数字人视频,而且支持多类角色及中英日韩多语种,最低价格仅 0.12 元每秒,广泛适用于广告、电商、娱乐、媒体、教育等众多场景。目前产品公测陆续开放中。

极简输入、高质输出:一张图实现分钟级数字人生成

可灵 AI 数字人极大降低了行业的制作门槛,用户只需提供一张角色图(支持写实人物、动漫、动物等多种角色),输入一段文字或音频,即可一键生成最高达 1080p 分辨率、48FPS 高帧率的高质量数字人视频。

该功能可支持生成最长达 1 分钟的数字人视频,可轻松满足产品讲解、新闻播报、在线教育等多种场景需求,结合会员优惠最低价仅 0.12 元 / 秒(标准价格:高品质模式 8 灵感值 / 秒,标准模式 4 灵感值 / 秒),让高品质数字人技术不再是少数专业机构的专利,真正赋能广大内容创作者与中小企业。

此外,为了实现“开箱即用”的便捷体验,可灵 AI 还提供了一站式解决方案。既支持用户上传自有素材,也可以使用内置的官方形象库、AI 生图功能以及近百种 TTS 音色,轻松完成从角色创建到配音的全流程。

角色演绎“神形兼备”

在数字人的核心能力——“表现力”上,可灵 AI 展示了其深厚的技术功底,不再满足于同类产品简单的音画同步,而是追求角色“神形兼备”的生动演绎。

在对口型这一基础指标上,可灵 AI 数字人展现出了业界领先的精准度。实测案例中,一位女歌手正演唱英文歌曲,其唇形与快速变化的歌词音节完美贴合,复杂口型也表现出色。而根据提示词“眼神专注自信地唱歌”,数字角色更呈现出自信的眼神、持麦的自然姿态,以及与观众互动的微笑,生动还原了歌手在舞台上的表演状态。

同时,凭借可灵视频模型的强大能力,可灵 AI 数字人展现出优秀的泛化性能,无论是写实人物、动漫卡通、动物形象,皆可生成高质量数字人视频。在卡通猫咪唱英文 Rap 的案例中,可灵 AI 精准地捕捉音频节奏,生成了一只一边说唱、一边随节奏自然摇摆身体的“Rapper 猫”,跨越不同角色风格界限,赋予角色生命力。

提示词驱动角色表演 情绪与动作精细可控

区别于仅“动嘴皮”的数字人,可灵 AI 数字人还带来了对情绪的深刻理解与表达,而且可通过提示词精细化控制角色情绪与肢体语言,实现“有灵魂的表演”。

在这个表现“愤怒”情绪的案例中,根据音频内容和提示词“内心全是气愤,非常生气”。模型精准地将这种抽象情绪转化为具体的面部微表情——紧锁的眉头、紧抿的嘴唇和充满压迫感的眼神,将角色的内心怒火展现得淋漓尽致。

基于可灵 AI 视频模型,依托多模态理解大模型与视频生成模型的深度融合,可灵 AI 数字人突破传统音画同步的表浅拟合,首次实现从听声音到懂意图的跨越。在口型准确度已达行业领先的基础上,可精准解析输入的语音、图像和提示词,对长视频中数字人情绪、动作与运镜作出精准规划,确保生成内容紧密呼应叙事意图与情感脉络,真正完成从对口型到情节演绎的升级。

技术驱动 打造数字人行业标杆

可灵 AI 数字人的卓越表现,得益于其背后多模态理解大模型与视频生成模型的深度融合。通过音画高度对齐的交叉注意力机制、强化口型的训练策略以及精细化的数据处理,实现了语音与唇形的精准同步,即使面对多语种、歌唱或极快语速的台词,仍能保证唇形与发音严丝合缝。而采用关键帧控制的架构,模型先构建高层次叙事骨架,再并行生成多个片段的数字人视频,可在保持身份一致的前提下,实现无限长度视频生成。

专业测试中,可灵 AI 数字人与行业知名产品 Heygen 及即梦数字人 (Omnihuman- 1 方案) 进行了效果对比。结果显示,可灵 AI 数字人在整体效果及多个细分维度上均表现优异,与即梦数字人 (Omnihuman-1 方案) 对比的整体 GSB 得分达到 2.39,与 Heygen 对比的整体 GSB 得分达到 1.37,位居行业领先。

可灵 AI 作为全球领先的视频生成大模型,自 2024 年 6 月发布以来已完成超 30 次迭代,用户规模突破 4500 万,生成视频数量超 2 亿,为超过 2 万家企业提供 API 服务,覆盖广告、影视、游戏等多个领域。随着可灵 AI 数字人的推出,将进一步降低行业创作门槛、提升制作标准,推动其在短视频、电商直播、在线教育、企业服务等领域的规模化应用。

来源:今日头条
原文标题:可灵 AI 推出全新数字人功能 – 今日头条
正文完
 0
小智
版权声明:本站原创文章,由 小智 于2025-09-26发表,共计1850字。
转载说明:除特殊说明外本站文章皆由CC-4.0协议发布,转载请注明出处。
使用智语AI写作智能工具,您将体验到ChatGPT中文版的强大功能。无论是撰写专业文章,还是创作引人入胜的故事,AI助手都能为您提供丰富的素材和创意,激发您的写作灵感。您只需输入几个关键词或主题,AI便会迅速为您生成相关内容,让您在短时间内完成写作任务。
利用AI智能写作工具,轻松生成高质量内容。无论是文章、博客还是创意写作,我们的免费 AI 助手都能帮助你提升写作效率,激发灵感。来智语AI体验 ChatGPT中文版,开启你的智能写作之旅!
评论(没有评论)
利用智语AI写作工具,轻松生成高质量内容。无论是文章、博客还是创意写作,我们的免费 AI 助手都能帮助你提升写作效ai率,激发灵感。来智语AI体验ChatGPT中文版,开启你的智能ai写作之旅!