今天,你尝试“文生图”了吗?

共计 4386 个字符,预计需要花费 11 分钟才能阅读完成。

近期,“文生图”现象引发了广泛关注,尽管它也被称作AI绘画或AI作画,但名称的差异并不重要,关键在于这种新兴技术将如何影响或颠覆我们的社会。

随着一幅幅精美的“文生图”在网络上涌现,抖音上随之出现了许多教授网友制作此类图像的视频教程,而在小红书和闲鱼等平台上,甚至出现了专门销售AI壁纸和文生图描述语句的商家。

简单而言,文生图是通过输入描述性语句,AI便能为你生成富有创意的绘画作品,这无疑是目前AI应用中最热门的领域之一——AI作画。事实上,它也是AIGC的一种形式。近年来,AI在写作、作曲等内容创作方面的应用愈发广泛。

对于“文生图”这一新兴事物,百度、谷歌等互联网巨头,以及众多创新型创业公司都已积极参与其中。

最近,百度推出的AI艺术与创意辅助平台——文心一格吸引了广泛的眼球。作为一家依靠人工智能技术不断发展的企业,百度在搜索引擎、自动驾驶、数字人以及AI语音交互等多个领域已取得了显著成就,因而大家对其在AI作画方面的表现也充满期待!

文生图的绘画效果究竟如何?

想知道文生图的效果如何?不妨先看一组图,大家自行评判。

我也进行了亲自测试,整体效果令人满意!

例如,输入“晴朗夏日竹林里的少年”,就生成了如下这幅图!

结果基本符合我的预期。

而当我输入“古风美男,长发飘飘”,并选择动漫风格时,生成的图像如下所示。

这张图片非常适合用作分析二次元及国漫相关主题文章的插图,效果简直棒极了。

当我输入“深秋,阳光下的小女孩”,生成的图像虽然基本可用,但也有改进空间。例如,手部细节并不尽如人意。这种情况几乎是当前所有“文生图”平台的共同问题,尤其是在脸部和手部细节的表现上。若能实现局部调整的功能,如圈定需要修改的区域并提供描述,系统再进行优化,结果将会更加理想。预计这将是“文心一格”未来的重要更新之一。

接着,我尝试了“深秋一位打太极拳男子的背影”,结果显示,背影的表现不够完整。

随后输入“天空中的一条龙”,生成的龙并不是我所期望的中国龙,于是我调整了描述为“云层中一条咆哮的中国龙”,最终得到了理想的效果。

经过多次尝试,我发现输入完整的句子比只输入几个关键词更能获得令人满意的结果,而且描述越详细,画面呈现的细节就越丰富。

关于处理时间,“文心一格”通常提示“请等待2分钟”,但实际上大约只需几十秒,便能够提供四种不同的结果供用户选择。

之前我使用过Stable Diffusion的AI绘图工具,由于其仅支持英文交互,这对我的表达造成了一定限制。尽管有翻译软件的辅助,使用过程依然显得繁琐。而百度的“文心一格”显然更适合中国用户。

显而易见,“文生图”技术在理解中文语义方面极为重要。对于设计师来说,准确把握客户需求是交付优质作品的关键,而在AI作画的过程中同样存在这样的挑战。“文心一格”在这方面的表现相对出色。

例如,输入“草原上奔跑的宝马”,究竟是指汽车的宝马,还是一匹骏马?再如,输入“佛跳墙”会生成什么内容?是一尊佛从墙上跳下来,还是这道菜的呈现?与其他文生图平台相比,“文心一格”显然对中国文化的理解更为准确。

如何实现对需求的精准理解?

我认为,对需求的精准把握应该是“文生图”技术最为重要的能力。那么,怎样才能做到这一点呢?

百度技术中台事业群市场部负责人张全文提到了一个关键概念——大模型。

张全文解释道:“文心一格”的“AI作图”产品得以顺利推出,得益于百度在飞桨和文心大模型基础上不断开展技术创新。百度的文心跨模态大模型ERNIE-ViLG 2.0是全球首个知识增强的AI绘图大模型,同时也是目前全球参数规模最大的AI作画大模型。近年来,深度学习算法的快速发展以及数据量的爆炸性增长,使得百度在训练大模型方面取得了显著进展。

所谓大模型,就是利用算法在大量、未标注且无规律的数据中进行自我学习,发现潜在规律,进而生成一个基础模型。然后在此基础上,结合各个领域的少量任务数据进行进一步训练和优化,使其能够适应多种应用场景。

AI艺术创作的崭新时代:从传统到未来

在2023年7月,百度利用其先进的大模型技术,成功复原了元代著名画家黄公望的经典作品《富春山居图》。这幅作品曾遭遇火灾,分裂为两部分,而在2011年之前的展览中,部分画卷首次在台北故宫博物院展出。百度的技术团队通过人工智能学习原画的笔触与风格,并鼓励普通用户利用该技术进行创作,补全这幅画作。每位参与者展现出了自己独特的《富春山居图》,每一幅作品都展现出令人惊叹的和谐美感,充分体现了AI技术的奇妙应用。

在当今科技迅速发展的背景下,AI绘画正处于一个飞速进步的时期。我们相信,这项技能在不久的将来将成为用户获取图像内容的一种基础选择,深度融入我们的日常生活和工作中。

除了AI绘画,文心大模型在各个行业的应用速度同样令人瞩目,其服务范围覆盖了多个领域。

根据张全文的介绍,文心大模型具备两大显著特点:知识增强与产业级应用。这两大特性使得文心大模型展现出良好的通用性与强大的泛化能力,作为人工智能技术的“基础设施”,它拓展了AI技术在实际应用中的场景,并深化了其在产业中的应用广度。

目前,文心大模型已广泛应用于搜索引擎、信息流及智能音箱等互联网产品,并通过飞桨开源平台及百度智能云等技术力量,渗透到工业、能源、金融、通信、媒体、教育等多个行业。

帮助用户在图像需求上实现“降本增效”

文生图技术的出现让我这个自媒体工作者感到非常兴奋。对我们这些自媒体创业者来说,任何能够提高效率并降低成本的技术都是值得欢迎的。

为了节省图片制作费用,我曾尝试了多种网站的服务,包括海报制作、AI抠图、照片漫画化等。出于节约设计费用的考虑,能省则省。几年来,我为五六个网站充值,但问题仍未得到有效解决,最终仍需人工设计来完成公众号封面。此外,文章配图的数量也尽量减少,甚至有时完全不配,以避免侵权风险。

熟悉知顿公号的朋友们会知道,我们经过一番尝试后,将公众号的图片风格确定为漫画风,目前由真人画师手绘。这样的选择带来了颜值、识别度和统一风格,且拥有自己的版权。代价是按照数量付费,使用越多,成本也就越高。

文生图技术的推出,确实能够在一定程度上解决封面设计的问题。如果能够定制风格,或者输入参考风格的图片,那么这种替代效果会更为理想。

目前,“文心一格”仍处于免费阶段。即使未来收费,预计也将采用会员制,整体成本依然大幅低于传统设计费用。

预计该技术将在设计和绘画领域率先落地,特别是在影视、动漫、游戏、媒体、广告、出版和时尚等行业,广泛的商业化前景即将到来。

文生图会否取代人类画师?

因此,许多人可能会担忧:“设计师和画师是否会失业?”这样的担忧并非没有道理,但历史的车轮始终向前推进,新技术在传统领域的解构与重塑从未停止。

从短期来看,文生图作为AI创作的辅助工具,仍然难以完全取代设计师和画师。毕竟很多真实世界的需求是目前AI技术无法准确理解或实现的。积极的一面是,设计师和画师可以利用AI提升创作效率,甚至激发无限的想象力。AI从海量数据中汲取的知识,为灵感的实现奠定了基础,而人类数千年的绘画历史则为AI文生图提供了可能性;AI生成图像过程中的随机性也为灵感增添了新元素,AI能够学习成千上万种人类绘制山峰的方式,甚至创造出“第千零一种可能”。

然而,我们也必须承认,AI绘画确实会对一些缺乏创意能力或绘画技能一般的人产生冲击。

回顾人类的发展历程,新技术的出现确实改变了许多行业。例如,电脑的普及和输入法的出现,使得打字员这一职业迅速消失。某些职业的消失并不全是坏事。例如,在中国古代,每位女性都需学习针织刺绣等手艺,以满足家庭的穿衣需求。在我小时候,冬天的棉衣裤和春秋的毛衣都是母亲亲手制作的。那时有“裁缝”这一专门职业,但如今裁缝几乎消失,取而代之的是服装设计师。精细化分工让服装生产实现了工业化,人们可以随处购买到衣物。

在技术浪潮来临之际,成为弄潮儿,还是被拍死在沙滩上,答案显而易见。作为绘画创作者,主动迎接“文生图”等新技术或许是最佳选择。正如人工智能专家吴军所说,“每一次技术革命,最初受益的都是那些发展和使用它的人,而远离和拒绝接受它的人,终将面临迷茫。”

激发普通人的绘画创作热情

AI绘画对于普通用户来说又意味着什么呢?在我看来,它更像是点燃了普通人的创作热情!

举个例子,一位父亲通过文心一格为女儿制作了一个绘本,讲述了他和妻子从学生时代相识、相爱,到结婚,再到妻子怀孕、布置女儿的房间,直至女儿成长为小学生的故事。这位不懂绘画的父亲,通过AI绘画技术和充满爱的语言,亲手制作了这样一个独特的记忆绘本。

绘画是一项需要投入时间和精力的技能。虽然在童年时期,许多人对绘画充满热情,但随着时间的推移,这种热情往往会在技法学习的过程中逐渐消减,能够坚持下来的实属少数。然而,AI绘画的出现为那些没有绘画基础的人提供了一个重新点燃创作热情的机会,使他们能够自由地进行创作。

当技术降低了创作的门槛时,这一领域便会迅速发展,就像生物界的“涌现”现象一样。在AI绘画的领域中,我们也能看到类似的涌现情况,这正是这项技术为普通人带来的新机遇。

谈及AIGC的发展,百度的首席执行官李彦宏曾指出,未来AIGC将经历三个阶段:“助手阶段、协作阶段和原创阶段”。在第一阶段,AIGC将帮助人类进行内容创作;第二阶段,AIGC将以虚拟人形态与人类共存;而在第三阶段,AIGC将能独立完成内容的创作。目前,我们仍然处于第一阶段。“随着技术的突破,AI进行绘画、制作视频,甚至构建完整的虚拟世界可能会变得如同使用手机拍照般简单。”对于AI绘画的未来,我们可以充满期待!

如何防止技术滥用?

每当新技术面世,人们总会产生担忧。“文生图”技术是否会被不当使用,实际上很难完全避免这种情况的发生。

例如,当输入描述一匹马倒在血泊中的场景时,平台可能会建议用户修改输入内容;而如果将描述改为一匹马倒在红色湖泊中,AI就能够自动生成相关图像。这就要求平台对输入的词汇进行严格筛选。我们有理由相信,拥有20年搜索引擎经验的百度在这方面的表现会优于其他公司。虽然面临诸多挑战,但总能找到解决方案,避免因小失大。

百度的董事长兼首席执行官李彦宏曾提出人工智能伦理的四大原则,其中包括AI最高原则是安全可控;AI的创新目标是推动人类平等获取技术和能力;AI的存在价值在于促进人类的学习和成长,而非取代人类;而AI的最终理想是为人类带来更多的自由与可能性。

这是技术应当努力追求的方向”,我对此深表赞同!(文 / 知顿 书华 )

来源:今日头条
原文标题:今天,你“文生图”了吗? – 今日头条
声明:
文章来自网络收集后经过ai改写发布,如不小心侵犯了您的权益,请联系本站删除,给您带来困扰,深表歉意!
正文完
 0
小智
版权声明:本站原创文章,由 小智 于2025-11-25发表,共计4386字。
转载说明:除特殊说明外本站文章皆由CC-4.0协议发布,转载请注明出处。
使用智语AI写作智能工具,您将体验到ChatGPT中文版的强大功能。无论是撰写专业文章,还是创作引人入胜的故事,AI助手都能为您提供丰富的素材和创意,激发您的写作灵感。您只需输入几个关键词或主题,AI便会迅速为您生成相关内容,让您在短时间内完成写作任务。
利用AI智能写作工具,轻松生成高质量内容。无论是文章、博客还是创意写作,我们的免费 AI 助手都能帮助你提升写作效率,激发灵感。来智语AI体验 ChatGPT中文版,开启你的智能写作之旅!
利用智语AI写作工具,轻松生成高质量内容。无论是文章、博客还是创意写作,我们的免费 AI 助手都能帮助你提升写作效ai率,激发灵感。来智语AI体验ChatGPT中文版,开启你的智能ai写作之旅!