共计 1350 个字符,预计需要花费 4 分钟才能阅读完成。
Sora 2 的最大突破在于它开始遵循物理法则,这一转变令人瞩目。
此前的 AI 视频技术中,篮球投篮后可能会突然消失,水面上的船只则能如纸片般漂浮。
而如今,Sora 2 已经对这些不合理现象进行了改善。
OpenAI 团队提供了一个例证:当篮球运动员的投篮未能命中时,球会根据现实情况反弹,而不是像以往那样“瞬间”进入篮筐。
再来看一个排球的例子,
在复杂的运动学和身体力学表征方面,该模型有了显著的进步。
这意味着生成的奥林匹克体操或水面漂浮物体,视觉效果不再显得虚假。

Sora 2 在运动表现、物理智能和身体力学方面实现了重要的飞跃。
提高了真实感:与前代相比,Sora 2 在物理效果和细节呈现上更为精准,视频画面愈加逼真。
这一版本的 Sora 2 生动而有趣,告别了沉闷的表现。
这是 Sora 2 最具影响力的更新,实属无可匹敌。
过去的 Sora 1 犹如一位无声者,
而 Sora 2 则为视频注入了灵魂。
该模型能够同步生成对话、音效及背景音乐,实现画面与声音的完美融合。
例如,如果用户输入“一场激烈的动漫战斗”,Sora 2 便能生成刀剑交锋时的火焰效果,并伴以精准的撞击音。
用户可以输入复杂的多句描述,甚至自定义模拟摄像机设备、物体的纹理,以及光线的反射方式,从而使创意得以更精准地实现。
它还能够根据多段指令生成多镜头片段(Multi-shot),为叙事增添更多电影感或动漫风格。
此次 OpenAI 发布的不仅是一个模型,更是一个全新的“赛道”——Sora App。
作为一个专注于生成及“二次创作”AI 短视频的垂直内容平台,Sora App 的潜力巨大。
其中“Cameo”功能尤为亮眼。用户可以通过一次身份验证,将自己的肖像和声音融入 AI 生成的视频中,成为其中的角色。
而且,用户对于自己的“客串”拥有完全的控制权,可以随时撤销授权,这一改变彻底颠覆了内容创作中的“演员选择”模式。
Pro 用户(需拥有 ChatGPT Pro 账户)可享受更快的生成速度,且能生成最高 1080p、时长达 20 秒且无水印的视频。

Sora 2 的推出,使得谷歌的 Veo 成为无法忽视的竞争对手。
这两大巨头都在竞争物理效果和音画同步的技术。
Veo 3 更像是一个高保真音频集成的专业工具,集成在现有平台(如 Gemini API)中。
而 Sora 2 则呈现出“模型 + 创建优先社交 App”的强大组合。
在低分辨率的应用场景下,Sora 2 或许具备更具成本优势。
但在高端、对音频集成有高需求的项目中,业界普遍认为 Veo 3 依旧保持着其独特的价值。

视频生成技术正式迈入了“卷”物理学与生态的新纪元。
Sora 2 不仅是技术上的一场胜利,更是产品形态的重大突破。
未来,拍摄电影或许只需一个简单的提示,甚至不再需要寻找演员。