共计 4484 个字符,预计需要花费 12 分钟才能阅读完成。
文 | 科技新知 前沿科技组,作者丨樱木,编辑丨江蓠 九黎
近期,一根香蕉在人工智能界引起了热议。
起初,这或许只是一张在朋友圈中快速传播的手办图片,然而事情的发展却超出了预期。不到两周的时间,谷歌推出的Nano Banana便在全球范围内生成了超过2亿张图片,亚太地区的用户热情最高。与此同时,英伟达的首席执行官黄仁勋也成为了这一应用的忠实用户,他在伦敦的记者会上毫不掩饰地表达了自己对Nano Banana的喜爱。
这种热潮还带动了Gemini App的用户激增,Nano Banana在短时间内为该应用吸引了超过1000万的新用户。更值得一提的是,Nano Banana的出现使得谷歌Gemini超越了长期占据苹果应用榜首的ChatGPT。

这种流行现象引起了连锁反应,海外的报道指出,为了应对Nano Banana带来的挑战,OpenAI以大约11亿美元的全股票交易方式收购了产品实验平台Statsig。此次交易后,Statsig的创始人Vijaye Raji将加入OpenAI,担任新设立的“应用部门首席技术官”。

在国内,字节跳动迅速推出了seedream4.0,目的在于通过这一策略增强豆包与即梦在用户心中的地位。与此同时,垂直领域的应用美图却面临危机,通用模型的崛起正在侵蚀这些垂直应用的市场,导致资本市场对其未来的不确定性,股价也因此经历了剧烈波动。
尽管外资投行依然对美图表示支持,但通用模型的威胁如同“达摩克利斯之剑”,对公司的前景产生了深远影响。
在这一背景下,人工智能领域的变革愈发明显,围绕这一超级应用的讨论开始蔓延。这样的波动让人不由自主地联想起GPT-4o带来的吉卜力画风,并引发了关于通用模型是否会取代垂直AI应用的讨论。
前OpenAI研究员姚顺雨在播客中提到,创业公司相较于大型模型公司最大的机会在于是否能够设计出不同的交互方式,这可能会使得模型的能力超越ChatGPT,演变为超级应用。
不过,从另一个视角看,主流研究者认为,长期专注于C端市场的垂直应用,对用户的需求有着深入的理解,而在B端,特定场景的专业知识也为这些公司建立了一定的竞争壁垒。毫无疑问,Nano Banana的出现如同一场突如其来的变革,触动了人工智能圈的神经。那么,这究竟是推动增长的助力,还是市场份额的侵略,值得我们深入探讨。
谷歌的“香蕉”如何撼动AI领域

若顺着姚顺雨的观点,Nano Banana确实在重塑图片创作的方式。
以往,大模型生成图像时,提示词的构建至关重要,用户必须掌握结构化的提示词才能得到理想的结果。在某些情况下,甚至需要专业的提示词来实现预期效果。
后续的修改,无论是利用Midjourney的“Vary”功能还是DALL-E进行局部重绘,都显得像是分散且独立的操作。
现如今,Nano Banana的快速反应和自然交互让创作过程更像是一场实时对话,而非简单的反复尝试。这也是许多人第一次体验到,AI图像生成变得如此灵活,用户无需不断调整复杂的提示词,而是通过简单的自然语言就能精准修改图像。
Nano Banana继承了Gemini大模型的深厚知识体系,这表明它不仅仅是个图像生成工具,更是一个具备常识和推理能力的智能系统。它能够理解并生成具有深层次语义的图像。在罗永浩与周鸿祎的最新对话中,也提及了语言在AI应用中的核心价值。
据报道,Nano Banana在风格一致性、多图融合、逐步精准编辑以及设计与风格迁移等多个方面表现卓越。
Nano Banana:图像编辑的新革命
Nano Banana通过更深入的理解和任务的精细拆分,达成了图像编辑的高度一致性。这一成就某种程度上体现了其模型定义所赋予的接近智能代理的能力。
从这个视角来看,正如姚顺雨所指出的,Nano Banana正在重新塑造人机交互方式,这也是它为何能在AI行业引起广泛关注的原因。更为重要的是,Nano Banana不仅在成本上具有竞争优势,而且运作速度也极快。根据Google的介绍,该模型的定价为每百万token 30美元,而生成一张图片大约需要1290个token,成本仅为0.039美元。
然而,从另一个角度分析,Nano Banana的发展路径似乎难以被复制。在团队的访谈及公开分享中,反复提到的几个关键方向包括文字渲染、交错生成、速度哲学以及世界知识的引入。这些关键词的背后,实际上透露出强大的模型能力所带来的降维打击。
此时,我们不禁要问:面对如此强大的工具,以及国内逐渐清晰的大模型厂商格局,是否意味着只要遵循Nano Banana的思路,就能成功颠覆垂直领域的AI应用呢?
美图的竞争优势在哪里?
在美图股价大幅下跌后,相关券商的调研报告也随之发布。9月2日,摩根士丹利的研究报告指出,美图的增长路径并未受到AI模型Nano Banana的冲击,其真正的价值在于提供传统AI模型无法覆盖的“最后一公里”解决方案。
报告强调,美图凭借在特定领域的深厚积累、独有的数据资源以及对核心付费功能的专注,建立了稳固的护城河。此外,公司对所有AI模型持开放和中立的态度,已将Nano Banana等新技术顺利整合至产品中。
与此同时,业内人士也表示,美图的C端业务主要依赖于对美颜和美体的细致理解,目前Nano的手办模型只是一种新玩法,并不会对C端主业构成威胁。而美图的B端业务则围绕商拍等核心功能,服务于大客户和小企业,其优势在于对特定场景的深入了解。在商拍环节,Nano主要专注于商品的多角度复制,以适应不同社交平台的模板,而美图则更加聚焦于商品与背景及模特的高匹配度。尽管国内外涌现了许多创业公司,但在这一全新市场,各家的玩法和策略都大相径庭,尚未进入存量竞争的阶段。
尽管如此,作为一个垂直应用,美图的AI转型依旧至关重要。自2022年起,美图在其Wink产品中首度推出视频画质修复技术,随后逐渐拓展至画质优化、视频分辨率提升及人像增强等一系列细分功能,形成了完整的画质修复能力矩阵。进入2023年,美图进一步丰富了AI功能,并正式进军B端市场,为美业领域量身定制AI测肤解决方案,开启了ToB业务的探索之旅。
美图与阿里巴巴的战略合作开启新篇章
在2024年,美图与阿里巴巴达成了一项高达2.5亿美元(约18亿元人民币)的战略投资协议。双方明确将在电商、人工智能技术及云计算这三大关键领域展开深入合作。在电商合作方面,双方将重点推动两个主要方向:首先,计划联合推出“AI试衣”功能,依托美图的AI试衣技术,结合阿里巴巴丰富的服装商家资源,从根本上改善用户在线购物体验的痛点;其次,美图设计室将向淘天商家后台开放部分核心功能,比如“AI商品图”的生成,帮助商家提升商品的视觉效果。
从上述信息中,我们可以清楚地看到,美图在市场中的定位颇为微妙。在C端市场,它通过AI技术不断进行自我升级;而在B端市场,则利用自身的技术为电商用户提供支持。无论在哪一方面,似乎都体现了技术积累后的有序连接与精细化操作。
某种程度上,美图的优势在于用户认知、使用体验和精细化管理,但这是否能使其维持现有业务模式的稳定性,仍需时间来验证。
另一方面,按照以往的策略,美图围绕着美图秀秀等细分领域的超级应用进行业务拓展。从某种角度来看,可能需要更深层次的互动方式变革,才能增强其在市场中的竞争力。同时,随着国内一些领先的模型厂商进入这一赛道,美图是否会面临更强的冲击,值得深入探讨。
美图是人工智能变革中的一个典型案例。每当大型模型公司技术溢出时,垂直领域的AI应用便会受到考验,而这种不确定性将是公司长期需要面对的挑战。
场景赋能将成为胜负关键
从硅谷的经验来看,大型模型公司与垂直AI公司的竞争始终是一个持续的话题。例如,Anthropic旗下的Cloud Code与编程应用Cursor之间的竞争,速度令人瞩目。然而,在面对这种竞争时,垂直AI似乎并没有太多应对措施。
投资人朱啸虎在一次采访中坦言,他在初期对AI编码不敢投资,认为这必然是大企业的天下。今年,中国在补贴外卖的同时,美国则在补贴AI编码,几乎都是处于负毛利的状态。用户支付的每月几十美元的订阅费,消耗的Token却可能达到几百美元,这些都是在用投资者的资金补贴程序员。程序员群体的忠诚度极低,他们会选择最便宜和最好用的API。
回到美图这次事件的核心,公司早前的重心是海外市场拓展。在摩根士丹利的报告中,美图设定了在2025至2028年内,将整体付费率提升至8-10%的首个目标,这是基于2024年4.7%的基础上的重大飞跃;从长远来看,公司的目标是休闲类产品付费率达到10%以上,以及生产力工具的付费率超过20%。
然而,要实现这一系列聚焦于“用户付费转化”的目标,美图面临的首要挑战是来自Nano Banana所代表的通用大模型的冲击:当“对话式创作”重塑了用户对图像AI的互动期待时,如果垂直应用仍旧停留在传统功能上,之前设定的付费率目标可能将面临落空的风险。
美图的应对策略是将Nano Banana技术整合进自身产品,同时与阿里巴巴共同深耕“AI试衣”等场景化服务,这为国产垂直AI的发展指明了方向。看似“巨头压制垂直”的局面,实际上已为转机打开了一扇窗。
危机并不在于大模型的技术溢出,而在于垂直行业对自身价值的误判——将“工具能力”等同于“用户价值”。而转机的关键在于不与大模型在参数算力上竞争,而是成为它们落地至实际场景的“翻译者”和“价值放大器”。毕竟,大模型提供的只是“通用能力的基础”,而垂直领域沉淀的用户认知、场景专业知识以及B端服务的闭环,才是将技术转化为用户愿意付费服务的根本,也决定了AI能否真正解决痛点。
对于国产垂直AI来说,真正的突破点并非仅在于“创造更好的产品”,而在于跳出与大模型对抗的思维框架,专注于“利用大模型赋能场景”。当通用技术与垂直场景深度结合时,所谓的“危机”便会转变为“差异化竞争”的机遇。毕竟,AI的终极战场不在于技术排名,而在于能否满足用户真实的需求。
或许,正如朱啸虎所言,AI时代的演变速度可能是移动互联网的三倍,甚至更快,因此许多机会会更快被验证。当年,移动互联网的许多工具应用仍能取得不错的结果,但在快速变化的AI时代,退出的可能性将大大增加。因此,创业者应以十年、二十年的视角来看待可持续发展的机会,而不是仅仅在与大企业的竞争中寻找出路。
信息
智百道,《深入体验谷歌Nano Banana后,我们揭示了其双面性》硬AI,《AI接管软件的又一实例?谷歌Nano Banana走红,美图股价大幅下跌》
美股IPO,《摩根士丹利:美图的“增长策略”,通过AI提升付费率,海外用户增长潜力巨大》
硅星人pro,《与朱啸虎对话:迁出中国,伪装成非中国AI创业公司,是无济于事的》
