共计 1989 个字符,预计需要花费 5 分钟才能阅读完成。
在6月12日,美图公司举行了主题为“聊聊AI工作流”的第三届美图影像节。公司透露,借助“AI工作流”来提升行业及用户的工作效率,同时,美图的全球VIP会员人数也创下了历史新高,截至6月11日已达1063万。
美图创始人、董事长兼首席执行官吴欣鸿在活动中指出,AI工作流正在重塑传统的工作流程。“未来,许多能力将迁移至云端,与客户端的计算能力相结合;在AI工作流的支持下,个人可以像一个团队一样工作,AI还能够自动化处理大量重复性任务,帮助非专业人士解决专业问题。此外,AI工作流中的模型能够根据数据进行自动迭代,速度远超人工作业。”
为了推动影像与设计领域的AI工作流,美图在现场升级了三款现有产品,并推出了三款全新产品,涵盖商业摄影、口播视频、电商设计、设计服务、游戏营销和视频生成等多个领域。其中,MOKI作为视频大模型的落地产品,专注于AI短片创作,能够帮助创作者快速制作动画短片、网文短剧、故事绘本以及音乐视频。
美图引领“AI工作流”新风潮
吴欣鸿强调,AI工作流正以颠覆性的方式改变传统工作方式,特别是在美图所在的影像和设计行业,AI成为推动创新和提高效率的关键因素。
在此次大会上,美图发布的六款新产品将为影像与设计行业带来崭新的工作流程。其中,美图云修V2在AI批量精修和色彩调节功能上进行了升级,极大提升了商业摄影客户的效率;开拍V2则增强了AI脚本、数字人和视频翻译等功能,帮助口播视频创作者解决策划、制作和变现的问题;美图设计室V3则改进了AI批量化和商品视频创作能力,支持团队协作,显著提高电商物料的设计产出;站酷也推出了一个高效、简便且售后保障的设计服务平台,连接了众多设计需求者与数以万计的专业设计师;奇觅则融合了美图的AI影像技术与睿晟的市场经验,为游戏营销提供高效的广告制作与精准投放服务;最后,MOKI专注于AI短片创作,使视频创作变得更加简单而高效。
六款新产品的发布进一步丰富了美图的AI产品生态。美图的应用层目前包括AI图像、视频、设计和营销四个核心模块,而生态层则由中国领先的视觉创意平台站酷和美图AI助手RoboNeo提供支持,模型层则由美图的奇想大模型(MiracleVision)为所有产品提供AI模型能力。

视频大模型的实际应用
早在2023年6月,美图推出了美图视觉大模型MiracleVision(奇想智能),该模型已于1月2日通过《生成式人工智能服务管理暂行办法》的备案,并计划向公众开放。
据悉,Sora发布后,美图对其视觉大模型的底层架构进行了反思,并紧急进行了内部升级,重新投入到图像和视频模型的训练中。在此次发布会上,美图透露,奇想大模型(MiracleVision)已升级至V5,采用了美图自研的DiT技术架构,涵盖图像、视频、音频和文本四大类型,具备更强的扩展性和更大的参数量,在语义理解、画面稳定性、动态连续性、主体一致性、内容可控性及生成时长等方面都有显著提升。
今年2月,OpenAI推出了文生视频模型Sora,引发了该领域的激烈竞争。然而,美图在实践中发现,借助类似的文生视频模型进行内容创作,故事整体性较差,且可控性不高。
为了解决这些问题,美图推出了AI短片创作工具MOKI。南都记者在现场观察到,使用MOKI后,当脚本、视觉风格和角色等前期设置完成后,AI能够自动生成分镜图并转换为视频素材,通过智能剪辑、AI配乐、音效和自动字幕等功能将素材连接,最终形成作品。

吴欣鸿表示,随着AI大模型的不断发展,AI应用将经历点、线、面三个阶段。美图正致力于将AI的各个模块组合成AI工作流,以帮助电商、广告、游戏、影视和动漫等行业进一步提升生产力。
结合美图的应用经验,吴欣鸿认为,当前AI技术的进步快于AI应用的实际落地;其次,优秀的概念并不等同于优秀的产品,能够将AI理念转化为成功产品的案例并不多;最后,只有当AI能够为用户创造价值时,用户才会愿意为这些AI产品付费。
为了推动AI应用的落地,第三届美图影像节现场,美图旗下可快速制作口播视频的软件“开拍”宣布推出“开拍AI助农计划”,提供与三农主题相关的AI脚本和素材,帮助新农民进行拍摄和视频制作,以AI技术促进农村经济的发展。同时,美图设计室还推出了“小微电商AI助力计划”,旨在支持义乌、广州、泉州等电商集聚城市的个体创业者,实现“一个人就是一支团队”的目标,后续还将启动“电商AI设计课程”,以帮助电商用户提升AI设计技能和订单转化率。
采写:南都记者 林文琪
