共计 1340 个字符,预计需要花费 4 分钟才能阅读完成。
经过十个月的公开预览,OpenAI于12月10日正式推出其人工智能视频生成模型Sora。这个系统能够根据用户的文本提示生成高质量视频,最新发布的Sora Turbo工具支持生成最长20秒的视频,并且能够提供多种视频变体。从12月10日起,Sora将对美国及其他地区的ChatGPT付费用户开放。
在展示环节中,OpenAI展示了Sora的多项新功能。该工具不仅能够通过文本提示生成视频,还支持基于静态图像和现有视频制作新内容。例如,用户可以上传一段视频片段,Sora将生成该片段的延续画面,从而使视频更长且更完整。
此外,Sora还引入了一个名为故事板(Storyboard)的功能,用户可以通过该选项详细描述期望视频在不同时间节点上展现的内容,从而更有效地指导视频片段的生成。同时,用户还可以浏览其他创作者制作的视频集锦。
自今年2月首次发布Sora预告以来,OpenAI便积极与电影制片厂、媒体高管和经纪公司展开合作,并允许部分艺术家和知名导演进行试用。
值得注意的是,OpenAI此次正式推出Sora并未在中国市场引起预期的轰动。实际上,“中国版Sora”正迅速崛起。今年年初,Sora发布了令人瞩目的60秒视频,但随后迟迟未上线,许多中国企业抓住了这一机会,率先推出视频大模型产品,包括字节跳动、快手、阿里云、腾讯、美图等互联网公司,及初创企业如Minimax、智谱、爱诗科技和生数科技等也在积极跟进。
例如,快手的可灵视频生成大模型,运用类似于Sora的技术,支持最高1080p的分辨率和最长2分钟的视频生成,同时提供首尾帧控制和镜头控制等功能。而字节跳动自主研发的视频生成模型Seaweed则能在60秒内生成5秒的高质量AI视频,较行业平均3至5分钟的制作时间有了显著提升。
在应用方面,OpenAI为导演提供了试用机会,国产视频生成大模型在影视行业的探索也已开启。今年9月,快手推出了“可灵AI”导演共创计划,由李少红、贾樟柯和叶锦添等九位导演共同利用可灵AI的技术制作了9部AIGC短片。这些短片的全部视频生成均由可灵AI完成,导演们则依靠视频生成大模型进行内容创作。至12月6日,所有九部影片已完成首映。许多影视行业上市公司也纷纷拥抱AIGC,为主营业务注入新活力。例如,博纳影业制作的AIGC连续性叙事科幻短剧集《三星堆:未来启示录》已在抖音上线,该剧集利用AIGC技术实现了从剧本创作到视频编辑的全流程工作。
开源证券指出,国产多模态视频大模型经过一年多的迭代,逐步提高了内容制作的能力,拓宽了创作的边界,预计未来AI在影视领域的商业化空间将不断扩大。不过,业内人士也表示,尽管视频生成大模型的商业化前景乐观,但在实际可用性上仍未达到大规模商用的程度,许多技术难题仍待解决,包括对物理规律的理解、高分辨率、镜头动作的连贯性以及视频时长等,都是行业竞争中亟需提升的关键要素。
图片
记者:袁璐