共计 2360 个字符,预计需要花费 6 分钟才能阅读完成。
本文转载自微信公众号:一泽Eze,作者为一泽Eze,文章标题为:《Google 利用文生图 AI 开始真正重塑行业|9 个测试案例,带你领略 Gemini 的能力边界》,配图
Google 终于发布了他们去年所承诺的“可持续对话生成图像”的 Gemini 文生图技术。

接下来,我们先进行总体评价:
1. Gemini(或称 Imagen3)是当前全设计行业,甚至整个碳基社会中最值得关注的文生图 AI;
2. 在理解自然语言的修改指令、复现材质质感以及局部细节的微调方面,它已经达到了部分创作环节完全可用的水准(当然,仍有一些案例有待改进);
3. 这几乎可称得上是 AI 的许愿机,甚至可以说“快变天了”也不为过。
在本文中,我们将通过 4 项能力测试和 5 个应用实例,带你深入了解 Gemini 的能力边界。
主要测试,挑战 AI 能力边界
主测试 1:简单形体的材质转换、持续微调形态细节,并显著改变视角
我们将通过一些极具挑战的案例,来测试 Gemini 文生图的能力极限。
这是我进行的第一个案例,刚开始时我并不清楚其能力边界,因此选择从简单形体入手,让它生成一个正方体。

整个案例的表现非常流畅,指令理解得当,材质转换顺利,基础形态保持不变,甚至能够大幅度调整相机视角,添加模特也毫无困难。
PS:这项“简单”案例的表现已经远超了其他文生图 AI,算是相当出色。
主测试 2:将手绘稿转换为设计渲染图,并顺带拍摄出产品宣传图
接下来,我们在测试 1 的基础上,进一步提升到设计生产的层级,利用一张手绘图作为基础,让 Gemini 完成整个产品造型概念设计的推敲。
这个案例显然是许多设计公司所关注的:

这幅图已经是最好的证明,似乎无须多加解读。
尽管在实际测试中,产品穿戴在人体上时并不总是稳定,常常伴随一些人像与产品的变形问题。
从手稿到3D渲染:设计的快速转变与创新将手绘草图转变为3D产品渲染图,以及局部设计的微调,现阶段的技术水平已经远远超越了普通本科设计专业毕业生的能力(实际上,我自己也是工业设计专业出身)。
在概念设计的早期阶段,我们还能够迅速生成模特使用场景的视觉图,进一步检验设计方案的效果。
另外,如果你对此仍然持怀疑态度,我想再补充一句:每一张图的生成时间不超过10秒……这还不算惊人,那还有什么能称得上呢?
主要测试三:同时生成多种风格的设计方案
我发誓,这是本文最后一个关于工业设计的案例,接下来将介绍更多关于游戏设计和自媒体应用的精彩案例。
虽然我一向对AI的评测比较谨慎,但在测试Gemini文生图的四个小时内,我几乎每分钟都在感叹它的强大。

这个案例是对工业设计造型推敲过程的进一步模拟。
一般来说,我们需要花费数天时间在犀牛建模软件中进行建模,接着又要在keyshot渲染软件中花费数天来调整材质和打光。
而一旦建模完成后,想要对模型进行造型的修改,简直就是对设计师的一种考验。
如今,Gemini能在20秒内一次性生成12张设计图……
主要测试四:抠图、背景更换与光影处理
完成产品设计后,接下来我们需要解决最终宣传材料的问题。
这时就需要进行抠图、背景更换和光影处理的工作流程。
首先,我们来抠图,随意换个背景:

没有问题,效果非常出色。
接下来看看商业级别的背景合成与光影效果:

再来引用一个在WaytoAGI上看到的实例:
简直令人惊叹,每次只需一句话,就能在10秒内得到相当稳定的效果。即便是复杂的光影效果,也能够处理得相当不错。
好了,测试到此,我只想说:
大碳奸恭迎硅基老爷重塑人类社会。
社区中的实例展示
让我们再来看看社区成员们尝试的一些应用实例,这也为我们带来了更多的启发。
更多应用之一:游戏角色与道具设计
关于游戏行业可能受到的影响与启示之一是:游戏内容设计(来自群友 @z.z.h)
应用实例之二:室内设计
根据来自用户 @Zhenyuan_Branton 的分享,室内设计也展现出其独特的魅力。用户可以将自己的设计草图和房屋照片上传,系统能够自动为其添加家具,完成整体设计的构思。

应用实例之三:教育与自媒体内容创作
如果将Gemini强大的功能运用到教育和自媒体领域,会产生怎样的效果呢?这种创意的结合无疑会带来新的可能性。

应用实例之四:漫画创作与上色
这一点得益于推特用户 @Linaqruf 的分享,展示了漫画绘制及改色的可能性。

应用实例之五:游戏中的复杂场景与动作转换预览
此项功能来源于推特用户 @Cristian Peñas 的启示。
掌握使用技巧,快速体验全新AI创作工具
你想知道如何使用这个神奇的工具吗?
首先,访问 Google AI Studio,网址是:
https://aistudio.google.com/prompts/new_chat
接着,在模型选项中选择 PREVIEW – Gemini 2.0 Flash Experimental(新版本)

然后,确保你选择了“Images and text”选项。

现在,让我们一起加入这个激动人心的旅程,见证硅基智能重塑人类社会的奇迹吧~
顺便提一下,我的一位设计师朋友对此作出如下评价:
以前我还可以假装慢工出细活,现在老板总是催促我赶紧让AI处理完毕。
文章来源于微信公众号:一泽Eze,作者为一泽Eze。
以上内容代表作者的独立见解,不代表虎嗅的立场。未经许可,禁止转载。如需授权,请联系 hezuo@huxiu.com
原文链接来自虎嗅:
https://www.huxiu.com/article/4062550.html
