“百模大战”周年回顾:305个国内大模型亮相,四成备案率,变现与破局的探索之路揭秘!

共计 4056 个字符,预计需要花费 11 分钟才能阅读完成。

每经记者:可杨 杨卉 每经编辑:兰素英

【编者按】:

近日,OpenAI发布了其最新的旗舰人工智能模型——GPT-4o。而早在2023年3月15日,GPT-4的问世便迅速引发了全球对生成式AI的关注,掀起了一场技术竞争的浪潮。

在中国,生成式大型模型的发布同样如火如荼。2023年3月16日,百度推出了“文心一言”大模型;紧接着,商汤科技于2023年4月10日发布了日日新;阿里巴巴在2023年4月11日推出了通义千问;而华为云则在2023年7月7日发布了盘古大模型3.0……各大企业争相布局,这场竞争被形象地称为“百模大战”。

经过一年多的时间,国内大型模型企业的发展现状如何?硅谷的生态又发生了怎样的变化?在这一领域,科技巨头与初创公司展现了哪些发展趋势?为此,《每日经济新闻》特别推出了《“百模大战”周年考》策划,深入探讨相关问题。

自从2023年3月15日OpenAI发布了多模态预训练大模型GPT-4以来,包括百度、华为、腾讯等科技巨头和百川智能等初创企业,还有智谱AI研究院等研究机构纷纷积极投入人工智能(AI)大模型的开发,试图搭上这一时代的快车,轰轰烈烈的“百模大战”由此展开。

根据《每日经济新闻》记者的不完全统计,截至2024年4月底,国内已推出305个大模型。而到5月16日,仅约140个大模型完成了生成式人工智能服务备案,约占总发布量的45.9%。这意味着,仍有约165个大模型尚未获得“过审”的机会。

这一严峻的现实背后,不仅存在技术方面的挑战,还有训练与推理过程中高昂的算力成本作为制约;即便能够跨过这一门槛,大模型企业如何实现商业化仍面临巨大困难。而对于那些可能在这场竞争中被“淘汰”的公司来说,未来的出路又在哪里呢?

现状分析:305个大模型发布,仅约四成完成备案

GPT-4的发布在全球引发了“炼大模型”的热潮,各大科技公司、初创企业和科研院校相继展开布局,没人愿意错过这场时代的盛宴。

根据《每日经济新闻》的统计,截至2024年4月底,国内共推出约305个大模型,在过去一年中推动了语言理解、图像识别等多个技术领域的进步。

图片

截至2024年5月16日,国内约140个大模型完成了生成式人工智能服务备案,占305个大模型的45.9%左右。

国家网信办相关负责人在接受媒体采访时表示,《办法》规定利用生成式人工智能技术向中华人民共和国境内公众提供生成文本、图片、音频、视频等服务的企业均需遵循该办法。

在已备案的大模型中,北京以70个备案大模型领跑全国,显示了其在人工智能领域的集聚效应。上海和广东紧随其后,分别备案28个和19个模型。

图片

而“140”这一数字同时也意味着,从备案的角度来看,大约还有165个大模型尚未通过备案,无法对公众提供服务。其中不乏一些备受关注的明星项目,比如曾被誉为“国内首个ChatGPT”的元语智能大模型ChatYuan。

未完成备案的项目中,学院派大模型占据相当一部分。在305个大模型中,有60个由大学或研究院所研发。或许是因为这些机构的项目更倾向于学术研究而非商业应用,备案的动力或流程不如企业迅速。此外,某些大模型正在转向“境内深度合成服务算法”的备案,例如恒生电子的大模型。

一位大模型行业创业者向《每日经济新闻》记者透露,当前模型相关的备案申请类似于专利申请,未必能够通过,且申请周期较长,大约需要4到6个月。他指出,目前大模型如果面向C端服务,就必须进行备案,而对于B端,一些大型客户会要求大模型公司完成备案。

不过他同时强调,未备案的大模型并不意味着会消失在市场上,许多来自研究所或大学的大模型仅用于研究,没有动力去完成备案

一家领先的大模型企业的从业者也指出,来自高校的模型如果仅在学术范围内使用,则可以不进行备案。

在“百模大战”的进程中,业界普遍认为最终可能只会留下3到5家大模型公司。“未来大模型行业可能会缩小为几个基本的底座,只有少数公司能够生存下来,”行行AI董事长、顺福资本创始人李明顺在接受《每日经济新闻》采访时坦言。

面临的困难:高昂的成本,日活千万需年收入超100亿才能覆盖数据中心支出

算力资源的稀缺性制约了大模型的发展。对许多大模型来说,未能在一周年时生存下来,算力的压力是一个重要原因。对于模型制造公司而言,目前主要的算力支出包括预训练和推理阶段。模型在推理应用阶段对算力的需求远远超过训练阶段。

根据中国工程院院士郑纬民的统计,在大模型训练过程中,70%的开销用于算力;而在推理阶段,95%的费用同样是用在算力上

以GPT-4为例,该模型的训练需要一万块英伟达A100芯片持续运行11个月。如果每块A100的成本为10000美元(具体价格因供应商和购买数量而异),那么一万块A100的总支出将接近1亿美元。

对于许多急于进入大模型市场的创业公司和科技企业来说,在烧了一段时间的钱后,他们发现算力不仅越来越贵,质量也逐渐下降。

郑纬民表示,目前市场上仅有三种系统能够支持大模型的训练。其中,基于英伟达GPU的系统非常稀缺;基于国产AI芯片的系统则面临应用不足和生态系统待完善的问题;而基于超级计算机的系统,虽然在软硬件协同设计良好的情况下可以完成大模型训练,但需在超算资源未被饱和的前提下进行,私人企业获得超算设备的机会相对较少。

据英特尔方面介绍,去年大模型领域的关注点主要集中在模型训练上,对成本和能耗关注不够。那时,各企业希望能够训练出自己的通用大模型。随着许多通用大模型的训练完成,今年的重点则转向推理。对企业而言,训练出大模型后需要实现变现并盈利,但目前市场上大多数大模型都是基于开源的,性能相似,训练的数据也大同小异,想要通过差异化盈利非常困难。

缺乏足够资金支持推理过程成为许多创业者失利的原因之一。为降低成本,一些企业正在尝试用CPU进行大模型推理。从当前的一些案例来看,在参数规模低于130亿的大模型中,CPU是可行的。

然而,即使成功度过推理阶段,企业在将大模型商业化上依然面临困难。行云集成电路的创始人季宇表示,大模型的商业落地与早期互联网时代有显著不同,边际成本依然非常高。每增加一个用户,基础设施需要增加的成本是显而易见的,而每月几十美元的订阅费用根本无法覆盖其高昂的支出。

更重要的是,现阶段大模型要实现大规模商业化,无论是在模型质量还是上下文长度等方面都面临进一步的要求,可能会不断提高边际成本。目前来看,日活跃用户达到千万的通用大模型一年需超过100亿元的收入才能覆盖其背后的数据中心成本,若要像互联网行业一样服务亿万用户,成本始终是一个无法逾越的障碍。

寻找新出路:专注应用或行业细分

如果“百模大战”的最终赢家只有少数几家公司,那么被淘汰的公司未来又将何去何从?

昆仑万维董事长方汉在接受《每日经济新闻》记者采访时表示,“百模大战”将会淘汰一部分公司,剩下的科技公司必定会继续加速前进。

行云集成电路创始人季宇认为,当下及未来两三年,大模型的商业探索将会在成本和Token质量之间进行妥协,逐渐分化为两派。

一派专注于质量,以高端系统打造高质量的通用大模型,谋求超级应用以覆盖高昂成本;另一派则优先考虑成本,利用足够便宜的硬件提供基本可用的Token质量,专注于垂直场景的落地。如果能够在同样的成本下获取更大规格的芯片,运行百亿或千亿参数的模型,支持超长上下文,商业化的空间将比现今更为广阔,这与曾经的显卡和游戏行业类似。

启明创投合伙人周志峰认为,现在绝大多数大模型企业都是外表是大模型,内里是应用,“具备模型能力的团队更容易在算法、模型、数据、模型加速方面进行优化,从而提供更好的产品体验,尤其相较于那些单纯使用第三方模型的公司。这类企业实际上不是模型公司,未来注定将成为应用公司。”

周志峰以字节跳动为例,指出从今日头条到抖音再到TikTok,背后都是AI驱动的推荐引擎。“在字节跳动的第一轮、第二轮融资时,与投资者讲述的更多是AI驱动的推荐引擎的故事,而如今不会再说字节跳动是一家AI技术公司,而是关注它的几个应用如何带来如此大规模的成功。”同样,今天的大部分大模型公司未来也将依靠最终实现的超级应用而被人们铭记。

李明顺也认同这一观点,他认为不久的将来,一些大模型公司将转型为应用公司,因为大模型领域不需要如此多的公司。“一些大模型公司的创始人有计划A和计划B,一旦他们的模型无法与领先的5家公司竞争,就会被迫在某些细分领域寻求生存,他们就会转型为应用型企业。”

在已成功备案的大模型中,部分模型已从通用型转向聚焦特定领域或行业的细分模型。

中科闻歌董事长王磊在接受《每日经济新闻》采访时表示,在过去的半年到一年内,适当开发小型行业大模型、降低参数规模的趋势愈发明显。真正成功的商业应用并不是制造一个庞大的模型,而是能够被用户广泛采用且价格适中的产品。实用性至关重要,不必为了显示规模而追求庞大,过高的成本会影响产品的市场推广和用户的采用,实用性应成为商业发展的主导原则。”

王磊指出,目前国内企业普遍意识到,最受欢迎的模型规模是70亿和130亿,300亿是单台推理的参数规模,较为受欢迎。“在我们的大模型发布时,国外网友评价这是企业级应用的小型参数规格。我认为一般企业可能难以承受更大规模的产品。对于文本生成任务,这一规模基本足够,但在一些特定领域的任务中,模型能力仍需强化。”

第四范式同样坚定地选择在行业大模型上投入。“如果无限扩大模型,放入无限数据,最后可能会达到AGI状态,但在每一个垂直应用中,我们需要平衡能力与成本。”创始人戴文渊在第四范式的业绩沟通会上曾表示,从技术角度看,第四范式追求AGI,但在具体客户场景中,也需要进行适当的裁剪,比如在某个考试中只考数学,而不必具备物理能力。

每日经济新闻

来源:今日头条
原文标题:“百模大战”周年考 | 国内大模型盘点:305 个大模型发布,备案率约四成,如何寻找变现、破局之路 – 今日头条
正文完
 0
小智
版权声明:本站原创文章,由 小智 于2025-10-03发表,共计4056字。
转载说明:除特殊说明外本站文章皆由CC-4.0协议发布,转载请注明出处。
使用智语AI写作智能工具,您将体验到ChatGPT中文版的强大功能。无论是撰写专业文章,还是创作引人入胜的故事,AI助手都能为您提供丰富的素材和创意,激发您的写作灵感。您只需输入几个关键词或主题,AI便会迅速为您生成相关内容,让您在短时间内完成写作任务。
利用AI智能写作工具,轻松生成高质量内容。无论是文章、博客还是创意写作,我们的免费 AI 助手都能帮助你提升写作效率,激发灵感。来智语AI体验 ChatGPT中文版,开启你的智能写作之旅!
利用智语AI写作工具,轻松生成高质量内容。无论是文章、博客还是创意写作,我们的免费 AI 助手都能帮助你提升写作效ai率,激发灵感。来智语AI体验ChatGPT中文版,开启你的智能ai写作之旅!