共计 3131 个字符,预计需要花费 8 分钟才能阅读完成。
最近,OpenAI推出的视频大模型Sora引起了全球的广泛关注。
OpenAI在社交媒体上透露:“自2月份首次展示Sora以来,我们一直在开发Sora Turbo——一个更快速的模型,今天我们为Plus和Pro用户提供了一款独立产品。”
然而,由于用户激增,ChatGPT遭遇了全球性宕机,Sora及其API也受到影响。北京时间12月12日下午,OpenAI宣布API、ChatGPT与Sora已恢复正常运行。
自今年2月首次推出Sora至今,已经过去了10个月,市面上涌现出多款AI视频大模型产品,如海螺AI、可灵AI、即梦AI等,吸引了大量用户体验。
全联并购公会信用管理委员会的专家安光勇指出,传统视频制作方式需要耗费大量人力、时间和资金,特别是在高质量内容的创作方面,AI视频大模型能够提供一种快速且低成本的替代方案。但是,这些模型仍面临一些挑战,例如生成内容的创意和质量不稳定,尤其是在细节方面可能出现失真,对复杂场景的适应能力也较弱,这限制了它们在高端影视制作中的应用。
AI视频工具层出不穷
据悉,Sora支持生成最高1080p分辨率、时长最长为20秒的视频,新增了按故事板组织、视频混合、重新剪辑等功能,使整体创作体验更加丰富多样,视频创作能力显著提升。
用户体验Sora的功能需拥有ChatGPT账号并进行充值,Pro用户每月需充值200美元,可获得500次高速生成视频的机会,而Plus用户每月充值20美元可享有50次视频生成的权利。
身处美国的AI领域关注者王胜(化名)向上游新闻记者表示,自己原本是ChatGPT的Plus用户,每月充值20美元,为了体验Sora,他决定充值200美元升级为Pro用户。Sora刚推出,他便开始使用。
王胜在12月13日对记者表示:“与其他类似的AI视频大模型相比,各有优缺点,Sora并没有明显的压倒性优势。”
在Sora推出的这10个月中,许多企业已经在该领域展开布局,其中包括国内知名互联网公司及多家初创企业。
字节跳动的剪映团队在今年5月推出了即梦AI,用户可以通过积分体验文生视频及图生视频功能,并能设置时长、比例等参数。对于需求较大的用户,即梦AI还推出了付费会员服务。
根据界面新闻报道,字节跳动旗下的创作工具剪映和CapCut在2024年实现了三位数的收入增长,总收入接近百亿元。一些公司内部人士认为,长期来看,即梦的市场价值可能是剪映的十倍,许多人对即梦的未来发展持乐观态度。
即梦AI文生视频功能页面。 图片来源/即梦AI网页版截图
快手在今年6月推出的可灵AI同样支持文生视频和图生视频功能,用户可以通过消耗“灵感值”进行体验。对于高需求用户,可灵AI提供多种付费服务,会员用户可享受快速生成通道、视频延长等专属功能。
在2024年Q3业绩电话会上,快手创始人兼CEO程一笑表示,可灵AI在9月实现了超过150万的月活跃用户。快手副总裁、大模型团队负责人张迪在12月12日举办的“2024AIGC视觉应用论坛”上表示,可灵AI已有超过600万用户,累计生成超过6500万个视频和1.75亿张图片。
可灵AI文生视频功能页面。 图片来源/可灵AI网页版截图
MiniMax旗下的海螺AI近期在海外市场表现突出。今年8月底,MiniMax推出其视频模型并应用于海螺AI,用户可通过消耗“贝壳”享受图生视频和文生视频的功能。与可灵AI和即梦AI类似,海螺AI也为高需求用户提供了会员付费服务。根据Minimax稀宇科技官方微信公众号的数据,今年9月,海螺AI网页版访问量增长超过800%,在AI产品的全球增速榜和国内增速榜中均位居第一。
海螺AI文生视频功能页面。 图片来源/海螺AI网页版截图
从事创意工作的王胜表示,他尝试过以上提到的AI视频工具,认为各款产品各具优劣,用户应根据具体需求和使用场景进行选择。
未来前景展望
可以说,AI视频大模型的到来,正在重塑视频制作的方式。
北京社科院副研究员王鹏指出:“AI视频大模型在B端和C端均有广泛应用前景。”在B端,AI视频大模型可用于广告营销、影视制作、在线教育等领域。例如,在广告营销中,能迅速生成高质量的视频素材,降低制作成本,提升营销效果;在影视制作中,可应用于特效制作、剪辑、合成等环节,从而提高制作效率和质量。而在C端,AI视频大模型可应用于家庭娱乐、社交分享及个人创作等领域,用户可以通过简单的文字描述或图片生成个性化视频,分享给家人和朋友。
某媒体节目导演张玉(化名)在12月13日表示:“我认为动画电影非常适合,梦幻场景也可以。”她提到,目前影视行业尚未广泛采用AI视频大模型。
某影视制作公司负责人徐源(化名)向记者表示:“目前在影视行业应用得不多。”
张玉指出,AI视频大模型尚未在该行业普及的原因在于使用成本较高。记者调查了即梦AI、可灵AI、海螺AI的收费标准,发现高级会员功能每年需充值数千元。
即梦AI会员收费标准。 图片来源/即梦AI网页版截图
可灵AI会员收费标准。 图片来源/可灵AI网页版截图
海螺AI会员收费标准。 图片来源/海螺AI网页版截图
王胜感叹道:“我有好几个可灵AI的账号,每个账号一年要几千元,而Sora每月需200美元,即梦AI每月199元……整体成本其实相当高。”
除了高昂的使用费用外,目前AI视频大模型的生成效果也妨碍了其在行业内的普及。“人物生成的效果不佳,无法传达真人的情感和感染力。”张玉说。
中国青年剧作家、导演向凯对上游新闻记者表示,目前AI视频大模型生成的内容同质化严重,画面质量不高,单纯依靠大模型生成内容尚不够,需要人工进一步辅助制作,相关产品仍需不断研发和升级。
王鹏指出,AI视频大模型市场正在迅速发展,吸引了众多大企业和初创公司投入其中。该领域蕴含着巨大的市场潜力和发展前景,同时也面临众多挑战和痛点。AI视频大模型在技术创新和研发能力方面需要不断提升,以应对日益激烈的市场竞争。此外,数据资源、算法优化等也存在一定的挑战。
他还认为,AI视频大模型在用户体验、隐私保护和版权问题等方面亟需完善。例如,如何提升视频生成的质量与效率,如何保障用户的隐私和数据安全,如何避免版权争议等问题都亟待解决。张玉也强调AI视频大模型应用的合规性不容忽视。
关于AI视频大模型对行业的影响,王胜认为,很多影视和广告制作可以借助AI完成,从而实现降本增效,很多人力会被替代。“但需要创造性的工作目前AI还无法满足,所以我们创作者的价值仍然存在。”
张玉表示,AI技术的发展势不可挡,但在复杂情感表达上,AI生成的角色无法替代人类。
王鹏认为,未来AI视频大模型技术将朝着更智能、高效和个性化的方向发展。竞争的焦点将集中在技术创新、用户体验、数据资源和算法优化等方面,行业可能呈现多元化的竞争格局。既有大企业凭借技术与资源优势占据领先地位,也有初创公司通过创新模式和灵活性脱颖而出。随着技术的不断进步和应用场景的扩大,AI视频大模型将在更多领域发挥重要作用,推动整个行业的持续发展与创新。
安光勇则认为,行业格局可能会呈现出“寡头化”的趋势。他表示,技术壁垒逐渐提高,资金、人才和技术将高度集中于少数头部企业,其他企业可能通过并购和合作寻求生存空间。在此过程中,行业的技术创新和产品迭代仍将相对滞后,竞争的核心依然是技术差异化和市场敏锐度。
上游新闻记者 齐鑫