共计 1537 个字符,预计需要花费 4 分钟才能阅读完成。
在周二的公告中,OpenAI 正式推出了其音视频生成模型 Sora 2,作为去年发布的 Sora 模型的全面升级版本。此外,他们还同时发布了一款名为“Sora”的社交应用,用户可以利用该应用生成包含自己和朋友形象的视频,并通过算法推荐的方式进行分享。值得一提的是,《连线》杂志(Wired)早前就曾报道过 OpenAI 在开发新社交平台的消息。
目前,这款应用以及 Sora 2 模型仍处于邀请注册阶段,尚未开放测试。尽管如此,OpenAI 已经展示了多组令人印象深刻的演示案例。其中,Sora 2 在遵循物理定律的方面表现得更加出色,使生成的视频更具真实感。公开的演示片段涵盖了沙滩排球、滑板特技、体操表演以及从跳板跳入水中的“炮弹式”跳水等多个场景。
OpenAI 在一篇博客中提到,传统的视频生成模型常常面临“过度理想化”的问题,为了满足文本提示,它们可能导致物体变形,甚至违背现实逻辑。举个例子,如果文本要求展示“篮球运动员投篮未中”的场景,旧模型可能会让篮球“瞬移”进篮筐,而在 Sora 2 中,当篮球运动员未能投篮命中时,篮球将会根据真实物理轨迹从篮板上弹开。
Sora 应用配备了一个名为“Cameos”的功能,用户可以通过这个功能将自己的形象“植入”任何由 Sora 生成的场景中。为了在生成的视频中使用个人形象,用户需要上传一段包含音视频的素材,以完成身份验证并捕捉外貌特征。
此外,该功能还允许用户与朋友分享自己的“Cameos”形象,授权他人在其生成的视频中使用个人形象,甚至可以创建多人同框的视频内容。
OpenAI 在博客中强调:“围绕‘Cameos’功能构建的社交应用,是体验 Sora 2 魔法的最佳途径。”
目前,Sora 应用的 iOS 版本已开放下载,初期仅在美国和加拿大推出,OpenAI 计划不久后向其他国家和地区扩展。尽管 Sora 社交平台仍需邀请码注册,但 ChatGPT Pro 订阅用户可以无须邀请直接体验 Sora 2 Pro 模型。
用户生成的视频可以在 Sora 应用的信息流中分享,该信息流模式与 Instagram Reels 及其他短视频平台相似。值得注意的是,Meta 上周刚刚宣布在其 Meta AI 应用中新增了名为“Vibes”的视频流功能。
在算法推荐机制方面,OpenAI 将综合考虑用户在 Sora 的使用行为、地理位置(通过 IP 地址获取)、过往内容互动记录及 ChatGPT 对话历史,以生成个性化的推荐。不过,用户能够选择关闭“ChatGPT 对话历史关联”功能。此外,Sora 应用通过 ChatGPT 内置的家长控制功能,允许家长设置“无限滚动限制”,关闭算法个性化推荐,并管理可与孩子互动的私信对象。然而,这些功能的有效性仍然依赖于家长的技术能力。
Sora 应用在上线初期将免费提供,OpenAI 解释称,此举是为了让用户能够自由探索其功能。目前唯一的盈利模式是在高需求时段对需要额外生成视频的用户收取费用。
推出社交平台的同时,OpenAI 还采取了严格的用户安全保护措施,毕竟在 ChatGPT 安全问题上,他们已经面临了不少挑战。虽然用户可以随时撤销他人对自己形象的使用授权,但这类授权依然存在被滥用的风险。即使用户信任被授权方,对方也可能生成具有误导性内容,从而对用户造成伤害。未经同意的 AI 生成视频(非自愿伪造视频)是 AI 视频领域面临的长期难题,这类内容可能造成严重危害,而目前明确规定平台责任的法律仍然稀缺。