共计 2256 个字符,预计需要花费 6 分钟才能阅读完成。
在9月30日的当地时间,OpenAI在官方网站上揭晓了他们最新推出的独立社交应用——“Sora”。该应用允许用户创建并分享由人工智能(AI)生成的视频内容,与朋友进行互动。
目前,这款应用仅在苹果的iOS平台上发布。根据App Store的描述,Sora是一款创新的创意工具,它运用OpenAI的尖端技术,将文字描述和图像转化为生动的带声视频。
与去年12月推出的首版Sora相比,新版本为用户提供了观看他人创作短片的功能,并允许用户创建一个高度逼真的AI虚拟形象,出现在自己的视频或朋友的视频中。
技术提升,实现音画同步
据新闻稿所述,这款应用依托于公司最新的视频生成模型“Sora 2”。OpenAI表示,这一模型突破了之前技术的一些限制。
在物理准确性与逼真度方面,Sora 2刷新了当前技术的最高标准(SOTA),在一致性和可控性方面也取得了显著进展。此外,它首次实现了“音画同步”的功能。
在Sora 2生成的视频示例中,可以看到一名花样滑冰运动员与一只白猫共舞;冲浪者在海浪中翻转;西部牛仔骑乘两匹马;以及诸多高清动画场景与赛博风格的片段。
OpenAI承认,尽管新模型仍有改进的空间,但在遵循物理定律方面明显优于之前的系统。同时,它的可控性也得到大幅提升,能够执行跨多个镜头的复杂指令。
通过这款新应用,OpenAI正在向建设社交媒体产品迈出重要一步。这使得公司与Meta等竞争对手之间的较量愈发直接,并可能为OpenAI开辟新的广告收入渠道,提升技术的曝光率。
OpenAI的软件工程师托马斯·迪姆森在简报会上表示:“很多人,包括我们内部的员工,最初对AI生成视频的想法持怀疑态度。”
他补充道:“但新增的‘客串’功能——允许用户自我插入视频——让团队意识到这种形式可能会为世界带来积极影响。”他还提到,“我发现许多社交平台已经偏离了‘人与人之间的联系’的最初目标。”
Sora团队的负责人比尔·皮布尔斯表示:“我们坚信,这或许会成为视频生成领域的ChatGPT时刻。”OpenAI的首席执行官奥特曼也在社交平台上发表了类似的看法。
为何选择独立应用
值得注意的是,此次Sora独立APP的发布与以往OpenAI通过开放API接口升级模型的方式截然不同,其社交应用的形态引起了市场的广泛关注。
市场分析师指出,OpenAI此举旨在利用其在视频领域的领先优势,迅速构建行业壁垒。
自去年Sora发布以来,因缺乏正式版和更新,国内外竞争对手迅速跟进,无论是谷歌的Veo3,还是国内的海螺、即梦、可灵等模型,都在市场上表现不俗,OpenAI在这一领域的先发优势几乎被消耗殆尽。
在Sora APP中,不仅可以构建个人的数字化分身,还可以获取朋友的分身演出授权,这可能显著提升用户的迁移和转化壁垒,帮助OpenAI在竞争对手尚未建立社交关系生态之前,将用户牢牢绑定于其生态系统内。
同时,在宣传片中,OpenAI强调了“人人都是创作者”的理念,试图将Sora定位为一个共创平台,而非当前短视频生态中以消费内容为主的平台。
为了实现这一生态,OpenAI必须通过自建应用收集一手数据(例如哪些视频更容易被分享,哪些内容更具传播性),在当今互联网优质数据日益稀缺的背景下,这些反映人类真实情感、审美和社交属性的数据,将成为OpenAI未来的重要私有资产。
利用这些数据与用户习惯,OpenAI能够进一步完善模型,形成正向循环的良性发展。
行业安全隐患加剧
然而,随着Sora功能的增强,可能会引发新的担忧:对影视行业从业者生计的冲击,以及辨别网络内容真伪的难度加大。
OpenAI表示,禁止用户生成包含公众人物的视频,用户也无法通过上传照片来生成他人的视频,但公众人物可选择制作自己的虚拟“客串”形象。
公司还补充道,使用Sora创作的视频都会带有水印,以便观众识别这是AI生成的内容,导出的文件同样如此。此外,该应用还禁用了屏幕录制功能,以控制视频的传播。
值得一提的是,OpenAI首席执行官萨姆·奥尔特曼与Meta首席执行官马克·扎克伯格已开始承认,人工智能(AI)泡沫的警告可能并非空穴来风,而英伟达CEO黄仁勋却对人工智能依旧持乐观态度。
在最近的一期播客中,黄仁勋不顾日益增加的谨慎情绪,转而关注他眼中的下一股主导力量:OpenAI。
黄仁勋预测,“OpenAI很可能成为全球下一个价值数万亿美元的超级公司”,其“双重指数级增长”将可能推动公司估值创下行业最快增长的历史记录。
“超级公司,如Meta和谷歌,将同时提供面向消费者和企业的服务。OpenAI极有可能成为全球下一个万亿级的巨头……投资应集中在我们所了解的领域,而这恰好是我们的特长。”他补充道。
在这一大胆预测出台之际,连人工智能领域的众多“倡导者”也发出警告,称AI的估值过高,建设过度。奥尔特曼本人也警告说,过多资金流入尚未经过验证的人工智能企业,而扎克伯格则将当前的基础设施狂热与过去的泡沫做了比较。
然而,黄仁勋坚持认为,怀疑者忽视了重塑经济的深层力量。在他的叙述中,这一切可以归结为基础物理学,而非炒作。
“通用计算时代已经结束。我认为这是各行业运行方式的代际变革。未来属于加速计算和人工智能。”他补充道。