共计 1299 个字符,预计需要花费 4 分钟才能阅读完成。
Sora 2 的重大进步在于它开始重视物理规律的应用。
与之前的 AI 视频相比,篮球可以消失,水中的船只似乎轻如纸片,这些现象在新版本中得到了显著修正。
OpenAI 团队举了一个生动的例子:当篮球运动员投篮失误时,篮球会智能地选择打板反弹,而不是像以前那样“瞬移”到篮筐里。
在排球的示例中,我们可以看到,模型在处理复杂的运动学和人物的身体力学方面有了显著的提升。
这意味着生成的奥林匹克体操或水面漂浮物体,视觉效果不再那么虚假。

Sora 2 在运动表现、物理智能和身体力学方面,确实取得了显著进展。
更高的真实感:与前一代产品相比,Sora 2 在物理效果和细节清晰度上提供了更高的准确性,使视频更加真实。
此次更新,Sora 2 终于展现出活力,不再是无声无息的存在。
这是 Sora 2 最具震撼力的升级,毫无疑问。
可以说,Sora 1 的表现相对沉闷,而 Sora 2 则为视频注入了灵魂。
该模型能够同步生成对话、音效和背景音乐,让画面与声音完美结合。
例如,当用户输入“一场激烈的动漫战斗”时,Sora 2 能够生成火焰特效与刀剑碰撞的音效。
用户还可以输入多条复杂的描述指令,甚至定制摄像设备、物体的纹理及光线反射方式,使得创意得以更精准地实现。
此外,它能够根据多段指令生成多个镜头片段,呈现出更具电影感或动漫风格的叙事效果。
这次 OpenAI 推出的不仅仅是一个模型,而是一个全新的平台——Sora App。
作为一个专注于生成和二次创作的短视频平台,Sora App 展现了其独特的垂直内容特性。
其中,“Cameo”功能尤为引人注目。用户通过身份验证,能够将自己的肖像和声音融入到 AI 生成的视频中,成为其中的角色。
更值得一提的是,用户对自己的“客串”拥有完全的控制权,随时可以撤回授权,这一创新彻底改变了内容创作中“找演员”的方式。
对于 Pro 用户(需要 ChatGPT Pro 账户),他们将享受到更快的生成速度,能够制作最高 1080p、长达 20 秒且无水印的视频。

Sora 2 的推出让人不禁联想到谷歌的 Veo。
这两大巨头在物理表现和音画同步方面展开了激烈竞争。
Veo 3 更像是集成在现有平台(如 Gemini API)上的专业工具,专注于高保真和音频集成。
而 Sora 2 则是一套“模型 + 社交 App”的组合拳,倾向于创建优先。
在低分辨率方面,Sora 2 可能更具成本效益。
然而,对于需要音频集成的高端项目,业内普遍认为 Veo 3 依然具备很高的价值。

视频生成技术已正式进入一个物理学和生态的全新竞争时代。
Sora 2 不仅是技术上的胜利,更是产品形态的成功。
未来,当你想拍摄电影时,或许只需一个 Prompt,甚至无需寻找演员。