共计 1312 个字符,预计需要花费 4 分钟才能阅读完成。


“香蕉”一度成为热门话题,而如今“种子”又浮出水面。国际知名的评测机构Artificial Analysis最近发布报告,指出字节跳动的Seedream 4.0已经在文生图和图像编辑领域双双排名第一,超越了谷歌的Gemini 2.5 Flash(Nano-Banana)。
Seedream 4.0是字节跳动最新推出的豆包图像创作模型,融合了文生图、图像编辑、多图融合及组图生成等多重功能,能够生成最高达4K分辨率的图像。该模型已在豆包App、即梦AI及扣子等产品中上线,同时也通过火山引擎向企业用户开放。
该模型具备多图输出及极强的主体一致性,能够直接生成4K高清图像。值得一提的是,它是全球首个支持4K高清输出的多模态生图工具。尽管Nano-Banana的3D手办功能备受关注,但Seedream 4.0在这方面的表现同样出色。
在中文和日文的识别能力上,Seedream 4.0的使用体验显著优于Nano-Banana。例如,一位日本用户使用该工具生成了一个茄子的手绘风格食谱图,画面细腻且可爱。

日本用户用Seedream 4.0生成的图像。
上海温哥华电影学院3D动画与视觉特效专业的主任徐一然也迅速体验了Seedream 4.0,他评价其超越了Nano-Banana。他表示:“理解能力和细节还原度都有了显著提升,能够更准确地重现原画的细节,想象力方面也得到了针对性提升。”他认为,这款工具的实用性非常强,而对于其是否会对传统艺术设计造成威胁,他表示有些担忧,但也指出其对美术和设计的重要性并没有减弱。
新一代AI创作工具:图像与视频生成的革命
徐一然将自己设计的图画转化为手办。
在多图输入创作方面,Seedream 4.0不仅能够将几幅图像有机结合为一幅新作,同时还支持连续输出多幅图像。以B站UP主檀东东Tango为例,他向AI提供了两个角色的形象图,要求生成8个分镜,随后又基于这些分镜直接制作了视频。结果显示,视频的整体一致性表现优异。未来,只需文本输入,结合AI配音与动画,AI短剧的数量将会大幅增加。

一张线稿可以转化为一段视频。徐一然提供
想要与偶像共同出演一段视频也变得十分简单,只需上传你与偶像的照片,轻松一键即可完成。
檀东东Tango还让AI生成了一幅图,其中刘亦菲在图一的伞下为图三的美国队长挡雨,结果表明,Seedream的表现远超Nano banana。在颜色还原方面,Seedream的表现更为精准,尤其是雨水打在伞和盾牌上的细节处理,生动且栩栩如生。

B站UP主檀东东Tango视频截图。
值得注意的是,Seedream 4.0在计算效率上相比于3.0提升了超过10倍,能够在秒级内生成2K分辨率的图像,这意味着用户只需花费少量金钱即可获得高质量的商用图像。目前来看,图像、音频和视频领域的潜力正逐渐被激发。
