共计 2694 个字符,预计需要花费 7 分钟才能阅读完成。
随着AI大模型文生图的问世,我们在为文章、宣传活动及短视频封面等创作配图时,迎来了效率和便利性的飞跃。本文将对国内几种主要的文生图工具进行比较,包括即梦、可灵和豆包,探讨提示词的使用策略,并展示不同工具在同一提示词下的生成效果。

在大模型尚未普及之前,我常常需要耗费大量时间在浏览器中寻找合适的封面图片。尽管偶尔能找到合适的图像,但清晰度却常常不尽如人意,这让为文章配图的任务变得十分繁琐。如果是为活动制作宣传图,几乎没有可能直接从网上获得,只能求助于平面设计师,或者花费金钱在网上寻找合适的设计师。
且设计师若手头有工作,往往需要排期,沟通后等待的时间也相对较长。然而,随着AI文生图的到来,文章封面、配图、宣传活动、Logo以及简单的图片编辑都可以通过AI轻松完成。最近几个月,我的文章封面和内部配图基本上都是依靠AI生成的。

此外,我最近也在制作短视频,其封面同样是通过AI生成,并且在封面上添加了相关文字信息,同时也制作了一些商业宣传的图文内容。
探索国内文生图工具的全景
在我个人开发的智能体项目中,所需的数字人像和背景图像让人难以分清是真实照片还是AI生成的图像。这样的技术进步,让图像的真实性和美观性都达到了一个新的高度。
除了这些基本的应用,我还在不断尝试更多场景,例如用户商品主图的制作,以及为模特更换服装等创意设计。
接下来的内容将涉及几个重要的方面:
a、我们将探讨国内常见的文生图工具,并分析它们各自的优缺点;
b、接着,我们会对文生图的提示词使用方法进行简要梳理;
c、最后,我们会在不同工具上使用相同的提示词生成图像,以便比较效果。
一、国内文生图工具概述
以下是对最新评测的国内主流文生图工具的对比分析,涵盖生成质量、功能特色、使用成本和适用场景等多个维度。
如何有效构建文生图的提示词?
在当今数字艺术创作中,许多文生图工具都提供了基础的免费使用额度,用户可以通过积分制或灵感值来获取服务。然而,对于频繁的商业需求,用户往往需要订阅相应的服务。
接下来,我们将探讨如何系统性地构建文生图的提示词,并总结出一些关键因素,以便提高图像生成的质量和效果。
一、提示词的构成要素
提示词的设计应当多维度考量,以下是一些业界实践中总结的主要组成部分:
1、内容描述方面
主体(Subject)
*示例:一名身着汉服的女孩,手握油纸伞。核心在于明确人物、动物或物体的特征,例如年龄、服饰和姿势等。细节可以包括材质(如陶瓷杯)、状态(热腾腾)和纹理(如毛茸茸)等。
环境与背景(Environment)
*示例:晨曦中的雪山顶,松枝上覆盖着冰晶。需要描述物理环境,如室内外场景、自然风光(如雪山或森林)及城市街景等。动态元素则包括天气(如暴雨或晴天)和光线(如霓虹反射或晨光)。
情感与氛围(Mood)
*示例:幽蓝色调带来的苍茫孤寂感。可以提及抽象意境,如孤独、梦幻或赛博朋克式的压抑感。
2、艺术风格方面
风格(Style)
*示例:水墨画风格或皮克斯动画质感。涉及的艺术流派包括水墨画、浮世绘、赛博朋克和吉卜力风格等。媒介形式可能是油画、水彩、3D渲染或摄影写实。
构图与视角(Composition)
*示例:鸟瞰视角与动态构图,留白20%。镜头语言可以采用广角、微距或俯拍等,构图方式包括中心对称或三分法,主体比例则需注意全身像或半身特写及留白空间的控制。
画质与细节(Quality)
*示例:超高清细节,焦点清晰,自然光晕。技术参数可采用8K超清、电影级光影和细腻纹理等,光影效果则包括体积光、丁达尔效应或HDR等。
在构建提示词时,也可以通过反向提示词(Negative Prompt)来排除不需要的元素如模糊或畸变等,示例包括避免水印和低分辨率的影响。
3、结构化提示词公式
可以使用一个通用框架:[主体] + [细节描述] | [环境背景] | [艺术风格] | [情感氛围] | [技术参数]。在撰写时应注意简洁明了,避免冗余词,并将核心词放在前面,确保描述清晰。例如,错误的描述“咖啡”可以改为“陶瓷杯装拿铁,表面有麦穗拉花,热气升腾”。
二、生成图像的实例分析
我们使用相同的提示词进行图像生成:
一位年轻貌美的女士,穿着休闲,坐在一个复古风格的咖啡馆木凳上,眼前的榆木桌上摆放着一杯陶瓷杯装的拿铁,表面有麦穗拉花,热气升腾。她微微偏头望向玻璃窗外,夕阳渐渐下落,阳光透过窗户洒在她的脸上,清晰可见脸上的细微毫毛。
要生成类似的图像,可以在百度上访问“AI”部分,选择“AI生图”功能,输入提示词后稍等片刻即可获得结果。

以下是生成的效果图:

对于可灵AI,只需访问其官网 https://app.klingai.com/cn,在左侧找到图片生成选项,并选择顶部的“文生图”,然后把提示词粘贴进去即可。
如何轻松生成AI图像的步骤详解
首先,访问豆包的官方网站,创建一个新的对话。在对话框的底部,您会看到“图片生成”选项,点击它即可开始操作。

在成功生成图像后,您可以对其进行进一步编辑,以实现更完美的效果。

接下来,打开即梦AI的官方网站,在页面顶部找到“文生图”功能,将提示词粘贴进去,然后点击生成按钮。

通过以上步骤,您就可以得到所需的生成效果图。
首先,访问腾讯元宝的官方网站,点击相关选项。在右侧的输入框中输入提示词,如图所示。尽管环境表现得相当真实,但生成的任务却呈现出卡通风格,这一点值得注意。

接下来,我们转向通义万相的官网
https://tongyi.aliyun.com/
在首页左侧找到生成图标,确保在输入框左侧选择“图像”选项,然后输入您的提示词,生成效果如下所示。

值得一提的是,第二章中展示的咖啡杯与提示词不匹配。此外,几张图片中椅子的材质并非木质,这也是一个问题。需要注意的是,该平台是收费的,注册时通常会赠送一些积分。

总体来看,虽然大部分模型生成的图片都能使用,但不同模型对提示词的反应效果各不相同。相对而言,免费的百度和豆包表现得较为出色。
本篇文章由人人都是产品经理的作者【markzou】撰写,微信公众账号为:【markzou的笔记】。文章为原创/授权发布,禁止转载。
封面图片来源于Unsplash,依据CC0协议。
