共计 1725 个字符,预计需要花费 5 分钟才能阅读完成。
[视频内容] 本文包含视频内容
OpenAI发布会上全新由Sora 2生成的精彩视频(02:01)
一年后的今晨,Sora 2惊艳登场。
在当地时间9月30日,人工智能领域的领军企业OpenAI正式推出其最新的视频与音频生成模型Sora 2。发布会伊始,播放了一段完全由Sora 2创作的视频,OpenAI的首席执行官山姆·奥特曼以及Sora项目负责人比尔·皮布尔斯(William Peebles,简称Bill)均在其中,以展示新功能。
据悉,Sora 2能完成以往视频生成模型难以实现的复杂任务,如奥运体操动作、在精确模拟浮力和刚性动力学的桨板上完成后空翻,甚至是猫在抓取物体时的三周半旋转。之前的视频模型往往过于“乐观”,它们会歪曲物体的形态,将现实扭曲,以便执行文本指令。例如,若篮球运动员投篮失误,球可能会瞬间出现在篮筐内。而在Sora 2中,若篮球投篮不中,球会真实地反弹回去。
在可控性方面,Sora 2也有了显著提升,它可以遵循跨镜头的复杂指令,准确保持世界状态的一致性;能够创建复杂的背景音景、语音及音效,并展现出极高的真实感;同时,现实世界的元素也能直接注入Sora 2中。
OpenAI指出,2024年2月发布的首代Sora模型可被视为视频生成领域的“GPT-1时刻”,而Sora 2则直接迈入了“GPT-3.5时刻”。
奥特曼在社交媒体上表示:“对许多人而言,这就像是‘创意领域的ChatGPT时刻’,非常新奇且引人入胜……创意领域或许即将迎来一次‘寒武纪大爆发’,随后艺术与娱乐的质量将显著提升。”
山姆·奥特曼在社交平台X上介绍Sora 2
与此同时,OpenAI还推出了基于Sora 2的Sora App。在该应用中,用户可以创作音视频内容,并在可定制的信息流中观看视频,还可以通过“客串”功能将自己或朋友带入视频中。
该应用自带防沉迷功能,默认限制青少年每天能看到的生成内容数量,并对该群体的客串功能实施了更严格的权限控制。OpenAI表示,除了自动化的安全防护措施外,还在扩大人工审核团队,以便快速应对可能的欺凌情况。此外,App内还设有由ChatGPT管理的家长控制功能。
同时,App在防止他人滥用肖像进行深度伪造、抵制不安或非法内容的保障方面,也设立了相应措施,定期评估Sora对用户情绪和幸福感的影响。
Sora App界面
目前,Sora 2仅对受邀用户开放,iOS应用可下载,安卓用户可通过网页使用,初步推广将在美国和加拿大展开,并计划扩展至其他国家。
Sora 2在初期将免费提供,使用限制相对宽松。ChatGPT Pro用户将能够体验实验性的更高质量Sora 2 Pro模型(将随后在Sora App中推出)。OpenAI还计划将Sora 2发布在API上,Sora 1 Turbo仍将继续可用,之前创建的内容将一并保留。
值得关注的是,OpenAI在今年上半年业绩也有所披露。据外媒报道,OpenAI上半年的营收达到了43亿美元,同比增长16%,月收入突破10亿美元,全年预计营收将达到130亿美元。
与此同时,OpenAI在此期间消耗了25亿美元,主要是用于人工智能研发和ChatGPT的运营,全年预计消耗将达85亿美元。截至报告期末,OpenAI的现金与证券约为175亿美元。
此外,OpenAI已经与英伟达签署了意向书,达成战略合作。OpenAI将利用英伟达的系统(意味着数百万台GPU)建设至少10GW的AI数据中心,以训练和运行下一代模型,同时英伟达也计划逐步向OpenAI投资1000亿美元。
OpenAI的首席财务官萨拉·弗莱尔(Sarah Friar)曾表示,OpenAI在未来某个时点有意上市。目前,OpenAI正在推进员工股票的二次出售,公司估值已达到5000亿美元。
澎湃新闻记者 秦盛
(本文来自澎湃新闻,更多原创资讯请下载“澎湃新闻”APP)