Sora 2震撼来袭！OpenAI开启视频时代的新篇章，犹如“GPT-3.5时刻”！

共计 1725 个字符，预计需要花费 5 分钟才能阅读完成。

[视频内容] 本文包含视频内容

OpenAI发布会上全新由Sora 2生成的精彩视频（02:01）

一年后的今晨，Sora 2惊艳登场。

在当地时间9月30日，人工智能领域的领军企业OpenAI正式推出其最新的视频与音频生成模型Sora 2。发布会伊始，播放了一段完全由Sora 2创作的视频，OpenAI的首席执行官山姆·奥特曼以及Sora项目负责人比尔·皮布尔斯（William Peebles，简称Bill）均在其中，以展示新功能。

据悉，Sora 2能完成以往视频生成模型难以实现的复杂任务，如奥运体操动作、在精确模拟浮力和刚性动力学的桨板上完成后空翻，甚至是猫在抓取物体时的三周半旋转。之前的视频模型往往过于“乐观”，它们会歪曲物体的形态，将现实扭曲，以便执行文本指令。例如，若篮球运动员投篮失误，球可能会瞬间出现在篮筐内。而在Sora 2中，若篮球投篮不中，球会真实地反弹回去。

在可控性方面，Sora 2也有了显著提升，它可以遵循跨镜头的复杂指令，准确保持世界状态的一致性；能够创建复杂的背景音景、语音及音效，并展现出极高的真实感；同时，现实世界的元素也能直接注入Sora 2中。

OpenAI指出，2024年2月发布的首代Sora模型可被视为视频生成领域的“GPT-1时刻”，而Sora 2则直接迈入了“GPT-3.5时刻”。

奥特曼在社交媒体上表示：“对许多人而言，这就像是‘创意领域的ChatGPT时刻’，非常新奇且引人入胜……创意领域或许即将迎来一次‘寒武纪大爆发’，随后艺术与娱乐的质量将显著提升。”

山姆·奥特曼在社交平台X上介绍Sora 2

与此同时，OpenAI还推出了基于Sora 2的Sora App。在该应用中，用户可以创作音视频内容，并在可定制的信息流中观看视频，还可以通过“客串”功能将自己或朋友带入视频中。

该应用自带防沉迷功能，默认限制青少年每天能看到的生成内容数量，并对该群体的客串功能实施了更严格的权限控制。OpenAI表示，除了自动化的安全防护措施外，还在扩大人工审核团队，以便快速应对可能的欺凌情况。此外，App内还设有由ChatGPT管理的家长控制功能。

同时，App在防止他人滥用肖像进行深度伪造、抵制不安或非法内容的保障方面，也设立了相应措施，定期评估Sora对用户情绪和幸福感的影响。

Sora App界面

目前，Sora 2仅对受邀用户开放，iOS应用可下载，安卓用户可通过网页使用，初步推广将在美国和加拿大展开，并计划扩展至其他国家。

Sora 2在初期将免费提供，使用限制相对宽松。ChatGPT Pro用户将能够体验实验性的更高质量Sora 2 Pro模型（将随后在Sora App中推出）。OpenAI还计划将Sora 2发布在API上，Sora 1 Turbo仍将继续可用，之前创建的内容将一并保留。

值得关注的是，OpenAI在今年上半年业绩也有所披露。据外媒报道，OpenAI上半年的营收达到了43亿美元，同比增长16%，月收入突破10亿美元，全年预计营收将达到130亿美元。

与此同时，OpenAI在此期间消耗了25亿美元，主要是用于人工智能研发和ChatGPT的运营，全年预计消耗将达85亿美元。截至报告期末，OpenAI的现金与证券约为175亿美元。