共计 2435 个字符,预计需要花费 7 分钟才能阅读完成。
随着AI大模型文生图的问世,文章配图、宣传活动以及短视频封面的制作变得更加高效和便捷。本文将对国内主要的文生图工具,如即梦、可灵和豆包等进行比较,探讨文生图提示词的使用方法,并展示各个工具在相同提示词下的生成效果。

在大模型生成图像的技术普及之前,为了寻找合适的封面图,我常常需要在网络上反复搜索,费时费力。有时虽能找到一张合适的图片,但清晰度却不尽如人意,这让配图的过程变得异常困难。若要为活动制作宣传图,网上几乎找不到合适的选择,只能求助于专业的设计师,或者花钱请人制作。
如果设计师正在忙于其他项目,我还得耐心等待,这样的沟通和排期无疑会增加时间成本。如今,借助大模型文生图,创作文章封面、配图、宣传资料、logo及简单的图片编辑都能够轻松实现。最近几个月,我的文章封面和内部配图几乎都是通过AI生成的。

此外,我最近也在制作短视频,而这些视频的封面同样是通过AI生成,并且上面还附有相关文字。

还有一些用于商业宣传的图文作品。

我所创作的数字人图像及其背景效果,令人难以分辨这是否为真实照片或是通过人工智能生成的作品。

与此同时,我还在不断探索其他场景的应用,比如为用户设计商品的主图,或者为模特更换服装等。

接下来,我想与大家分享:
a、国内常见的文生图工具,它们各自的优缺点;
b、关于文生图的提示词使用方法的简单概述;
c、最后,我们将利用相同的提示词在不同工具上生成图像,来对比效果。
一、国内
以下是最新评测的国内主流文生图工具的对比,涵盖生成质量、功能特点、使用成本及适用场景等多个方面的分析:
探索文生图生成工具的使用策略与效果在众多文生图生成工具中,大多数都提供一定的免费使用额度,例如利用积分系统或灵感值。然而,当涉及到高频商用时,通常需要订阅相应的服务。
在电商运营领域,通义万相(依托于淘宝数据)和可灵AI(提供虚拟试穿体验)等工具备受关注。
一、提示词构建
构建有效的文生图提示词需要从多个角度进行系统化思考,以下是依据行业实践提炼的关键要素:
1. 内容描述
主体特征(Subject):例如:“一位身穿汉服的少女,手握油纸伞。”核心对象需要明确,包括人物、动物或物体的具体特征,如年龄、服饰及姿态等。细节方面,建议涵盖材质、状态和纹理等元素。
环境与背景(Environment):例如:“晨曦照耀下的雪山,松枝上覆盖着冰晶。”需要考虑物理场景,如室内或室外,自然景观(如雪山或森林),以及城市街景等。动态元素可以包括天气状况和光线变化。
情感与氛围(Mood):例如:“幽蓝色调营造出苍茫的孤寂感。”抽象意境要关注孤独感、梦幻感等情绪表达。
2. 艺术控制
风格(Style):例如:“采用水墨画风格,体现皮克斯动画质感。”艺术流派可以是水墨画、浮世绘等,媒介形式则可选择油画、水彩等。
构图与视角(Composition):例如:“运用鸟瞰视角,动态构图,留白约20%。”考虑镜头语言和主体比例等。
画质与细节(Quality):例如:“呈现超写实细节,焦点清晰且自然光影效果出色。”技术参数应包括8K超清和细腻纹理等。
反向提示词(Negative Prompt):需排除模糊、畸变等不良元素,例如避免水印和低分辨率等问题。
结构化公式(万能框架):[主体]+[细节描述] | [环境背景] | [艺术风格] | [情感氛围] | [技术参数]。在描述时,要做到简洁精准,避免冗余词汇。
错误示例:“一杯咖啡” → 正确描述:“陶瓷杯装的拿铁,表面有麦穗拉花,热气袅袅。”
二、生成效果展示
我们以相同提示词为例:
描述:一位年轻貌美的女士,穿着休闲服,坐在复古咖啡馆的木凳上,榆木桌上放着一杯陶瓷杯装的拿铁,表面的麦穗拉花热气升腾。她微微侧头望向窗外,夕阳正在下落,阳光透过窗户洒在她的脸上,清晰可见脸上的细腻毫毛。
在百度上,点击“AI”选项,选择“AI生图”,输入提示词后等待几秒即可生成结果。

以下是生成的效果图:

可灵AI官网访问方式:直接进入可灵AI官网,在左侧找到图片生成选项,选择“文生图”,然后粘贴提示词即可。
如何高效生成图片:详细步骤解析
首先,访问豆包的官方网站。在网站中创建一个新的对话框,随后在对话框底部选择“图片生成”功能。

接着,您可以查看生成的效果图,并对其进行进一步的编辑,以达到理想的效果。

此外,如果您使用即梦AI,只需打开其官网,在页面顶部选择“文成图”,将提示词粘贴进去,然后点击生成即可。

最后,您可以查看生成的效果图,确保它符合您的需求。
探索腾讯元宝与通义万相的图像生成体验
在访问腾讯元宝的官方网站时,用户可以轻松找到输入框,并在右侧填写提示词。生成的图像展示了一个有趣的对比:环境真实而任务却显得卡通化,实在有些不尽如人意。

接下来,让我们走进通义万相的官网,链接为:https://tongyi.aliyun.com/。在页面的左侧,您会找到生成图标,切换到图像选项后,可以在下方输入框中填写提示词,生成的效果令人瞩目。

不过,值得注意的是,生成的图像有时会出现不符的问题,比如第二章中的咖啡杯与提示词不匹配,另外一些图像中的凳子并非木制,这些都需要改进。此外,该平台是收费的,注册时会赠送一些积分。

综合来看,多数模型生成的图像可用,然而不同模型对提示词的响应效果各异。相比之下,免费的百度与豆包表现还算不错。
本文由人人都是产品经理作者【markzou】撰写,微信公众号为:【markzou的笔记】。此文为原创/授权发布于人人都是产品经理,未经许可,禁止转载。
题图来源于Unsplash,基于CC0协议。
