共计 1195 个字符,预计需要花费 3 分钟才能阅读完成。
与以往的 AI 视频生成技术相比,Sora 能够创建复杂而连贯的场景,这背后有哪些技术创新值得关注呢?

图 1

Sora2 生成的视频

Sora 生成的视频
Sora2 的发布再次推动了视频生成技术的实用化进程,较之 Sora,
Sora2 的主要提升
1. 视频与音频的同步生成:Sora 2 不仅能够生成视觉效果,还可以生成与画面完全同步的语音和音效(如对话和环境音),从而提升作品的整体性。
2. 更加真实的物理一致性与动作流畅性:OpenAI 表示 Sora 2 在物体运动、重力和流体等物理现象上表现得更加“准确”,同时帧与帧之间的衔接也得到了显著改善(避免了常见的抖动和错位问题)。
3. 更强的控制与编辑能力:新增了对场景、镜头、主体动作及“Remix/ 变体”交互的控制,使创作者能够更方便地进行迭代并创造风格或剧情的变种。OpenAI 还强调了提供创作工具和模板的重要性。
4. 自我 / 他人“Cameo”与共同创作功能:Sora 应用允许用户将自己或获得授权的人物“插入”到 AI 生成的视频中(即自我插入),但需获取特别认证和被插入者的同意;平台声称被插入对象对生成内容享有移除和访问控制权(共拥有权 / 撤回控制)。
5. 使用限制与安全政策:明确禁止在未获授权的情况下生成公众人物或未授权个人的逼真视频,严禁色情和极端暴力内容,并内置审查和过滤机制,OpenAI 同时指出政策未来可能会有所调整。

Sora2 的影响
- 高参与度与快速传播 :大量用户利用 Sora2 创造“Sam Altman”梗、名人段子和夸张情节(如偷 GPU、rap 和恶搞片段等),这些内容在 X 平台和 Reddit 上迅速传播并被改编,许多帖子充满娱乐性,从而推动了传播。
- 生成质量与趣味性 :许多早期用户反映,Sora2 在“手机照片转视频”、“短镜头剪辑风格”和“拟声 / 配音”方面超越了竞争对手(部分用户甚至认为其比 Veo 更自然或更符合社交媒体风格)。同时,音频(对话和音效)与镜头切换的一致性被多次提及作为明显改进之处。

- 误导性与事实核查成本增加 :研究者和新闻机构警告,Sora2 使得“以假乱真”的视频制作变得更加容易,从而加重了虚假信息传播的难度和检测成本。华盛顿邮报及其他评论员将 Sora2 视为“可访问深度伪造时代”的一个重要标志。

- 商业与创作者视角 :短期内,Sora2 具备极强的“吸引眼球”能力,但其对创作者生态的长期影响(替代性与辅助性)成为热议话题:一些创作者忧虑收入与原创权利受到挤压,而另一些创作者则将其视为增长曝光的新工具。
来源:知乎
原文标题:OpenAISora 的出现,对现有视频生成技术意味着什么?– 知乎
声明:
文章来自网络收集后经过 ai 改写发布,如不小心侵犯了您的权益,请联系本站删除,给您带来困扰,深表歉意!
正文完