共计 1178 个字符,预计需要花费 3 分钟才能阅读完成。
在周一的当地时间,OpenAI正式向用户推出了其人工智能视频生成模型Sora。该系统能够根据用户输入的文本提示,生成极为真实的视频。这一发布距离OpenAI首次展示该产品的预览,已经过去了整整十个月。
根据OpenAI的说明,Sora将在当天稍晚时间向美国及其他市场的ChatGPT付费用户开放。更新后的工具Sora Turbo能够生成最长20秒的视频,并提供多种不同版本。自今年2月首次预告Sora以来,OpenAI与多家电影制片厂、媒体高层及经纪公司进行了深入的讨论。此外,一些艺术家、知名演员和导演也获得了试用该服务的机会。OpenAI表示,Sora是理解和模拟现实的重要AI技术,为能够与物理世界互动的模型开发奠定了基础。
然而,在早期的测试阶段,Sora暴露出了一些明显的短板。报告指出,在一次测试中,Sora出现了“多余肢体”的情况,并在理解物理现象方面存在不足。与图像生成器或聊天机器人相比,Sora在生成每个视频时所需的时间和计算资源也明显更高。OpenAI的首席执行官奥尔特曼表示,初期使用Sora的权限有限,ChatGPT Plus订阅用户每月可以生成50个低分辨率的视频,而ChatGPT Pro订阅用户则能无限制生成“较慢”的高分辨率视频,以及500个快速生成的视频。
Sora的一个显著特点是它能够真实再现物理世界,OpenAI称之为“新兴的模拟能力”。在此前,并没有任何文本视频模型能够媲美这一能力。具体来说,Sora能够在一个生成的视频中创建多个镜头,并准确展现角色和视觉风格。用户可以制作最长达1分钟的视频,同时也能根据需求生成短视频。它支持制作不同分辨率的竖版、方形和横版视频,并且计算需求越高,视频质量自然也会随之提升。评论认为,本周一上线的Sora与OpenArt的AI工具DALL-E相似,用户输入期望的场景,Sora便会提供高清视频剪辑的反馈。
Sora的发布是OpenAI为期12天的产品直播活动中的重要一环。上周,OpenAI还推出了更高价位的ChatGPT Pro订阅选项,用户可以无限制地访问OpenAI最强大的AI模型。在定价方面,Sora被纳入OpenAI的两个产品套餐中,其中ChatGPT Plus每月收费20美元,允许订阅用户生成最高720p分辨率、最长5秒的视频;而ChatGPT Pro每月收费200美元,用户可以无限量生成高达1080p分辨率、最长20秒的视频,并且可以同时生成五个视频,所生成的视频可无水印下载。