共计 1291 个字符,预计需要花费 4 分钟才能阅读完成。

在“香蕉”风靡之际,“种子”也悄然登场。国际知名评测机构Artificial Analysis最新公布了字节跳动的Seedream 4.0已经在文生图与图像编辑领域夺得了第一名,成功超越了谷歌的Gemini 2.5 Flash(Nano-Banana)。
Seedream 4.0是字节跳动推出的最新豆包图像创作模型。该模型融合了文生图、图像编辑、多图融合以及组图生成等多项功能,支持最高4K分辨率的图像生成,已在豆包App、即梦AI及扣子等平台上线,并通过火山引擎向企业客户开放。
该模型具备多图输出、卓越的主体一致性,并且能够直接生成4K高清图像。值得一提的是,它是全球首个具备4K高清直接输出的多模态生图工具。而Nano banana的3D手办功能在Seedream 4.0中也获得了出色的表现。
在中文和日文的识别能力上,Seedream 4.0的使用体验显著优于Nano banana。例如,有位日本用户使用它生成了一幅细腻可爱的手绘风格茄子料理食谱图。

日本用户利用Seedream 4.0生成的图像。
上海温哥华电影学院3D动画与视觉特效专业的主任徐一然对Seedream 4.0进行了尝试,他表示该工具已经超越了Nano banana。他指出:“它的理解力和还原度大幅提升,能够准确还原原画的细节,并在想象力方面也有针对性的增强。”他认为,这是一款极具实用性的工具,尽管他对其可能带来的威胁有所担忧,但他认为这并不会削弱美术和设计的重要性。

徐一然将自创的设计图转化为手办。
Seedream 4.0不仅可以进行多图输入创作,还能逻辑性地将几张图合并为一幅。此外,它还支持连续多图输出。B站UP主檀东东Tango通过给AI提供两个角色形象图,要求其一次性生成8个分镜图,接着根据分镜直接生成视频,结果显示视频的一致性表现非常出色。这意味着,未来只需有人撰写文本,结合AI配音和动画,AI短剧将会如雨后春笋般涌现。
国产短剧生成工具的崛起:AI技术的惊人进步只需上传你和偶像的照片,便能轻松制作一段视频,这一切都变得如此简单。
B站的创作者檀东东Tango尝试通过AI合成一幅图像,展现刘亦菲为美国队长遮雨的场景。经过比较,Seedream的表现明显优于Nano banana,特别是在衣物色彩的还原和场景细节的表现上,如雨滴在伞上的落下和盾牌上的细腻纹理都展现得淋漓尽致。

B站UP主檀东东Tango视频截图。
值得一提的是,4.0版本的计算效率相比于3.0提升了超过十倍,并且可以在几秒钟内生成2K高清图片,仅需几毛钱就能获得一张适合商业使用的图像。由此可见,图像、视频和音频领域的潜力才刚刚开始显现。
原标题:《超越“纳米香蕉”的国产文生图工具来了,特别懂中文,一个人就能做短剧》
栏目主编:戎兵
