重磅发布!智谱推出3550亿参数GLM-4.5模型,或将多项性能超越Kimi K2,跻身全球第三!

共计 2482 个字符,预计需要花费 7 分钟才能阅读完成。

国内的大模型领域竞争异常激烈。

在Kimi K2、MiniMax M2和阶跃星辰Step-3模型发布不到一个月的情况下,智谱即将推出新一代的旗舰模型。

根据7月28日的最新消息,智谱刚刚在全球范围内发布了新一代GLM-4.5系列旗舰模型,专为AI智能体应用设计,采用了混合专家(MoE)架构,其推理能力、代码处理及综合智能体能力均已达到开源模型中的SOTA水平。综合评分显示,GLM-4.5在全球模型中排名第三,成为国产模型第一,开源模型中也名列前茅,许多评分超越了DeepSeek-R1-0528(55.9)和Kimi K2(53.1)等多种模型。

GLM-4.5系列包含两款产品:具有3550亿总参数和320亿激活参数的GLM-4.5,以及参数数量为1060亿的GLM-4.5-Air。目前,这两款模型已经在Hugging Face和ModelScope平台上全面开源,API也已在智谱开放平台上线,用户可以在智谱清言和z.ai官网上免费体验完整版的GLM-4.5。

智谱的首席执行官张鹏此前向记者表示,智谱将继续专注于行业智能体产品和解决方案,同时向企业提供MaaS服务。此外,AGI的模型能力需要全面性,因为人类在处理复杂任务时会遭遇多模态与复杂交互的挑战,这就像木桶不能有短板,能力的需求也是全方位的。

“不可否认的是,AGI的发展仍处于初期阶段,目前的模型能力尚无法完全模拟人类的水平。”张鹏曾坦言。

智谱GLM-4.5的评测数据信息

智谱成立于2019年,公司的愿景是“让机器像人类一样思考”,并研发了拥有自主知识产权的GLM大模型预训练架构。自2023年3月智谱推出千亿开源基座对话模型ChatGLM系列以来,GLM大模型经历了四次重要版本迭代,累计发布超过20款AI模型技术和产品。

在商业化方面,截至2023年底,智谱已经拥有超过2000家生态合作伙伴,超过1000个大规模应用,同时与200多家企业深度合作,智谱GLM系列大模型已广泛应用于金融、医疗、教育等多个领域;在C端层面,截至2024年底,智谱清言的用户数突破2500万,付费功能已陆续上线,年度经常性收入(ARR)超过千万元。

融资方面,在今年7月临近IPO上市之际,智谱宣布获得来自上海国资的10亿元战略融资;在此之前,智谱还获得了杭州城投产业基金、上城资本、珠海华发集团和四川成都高新区等多家机构的投资。统计数据显示,截至目前,智谱的累计融资超过百亿元,投后估值已达200亿元,投资者包括高瓴资本、启明创投、君联资本等知名投资机构,以及美团、阿里、腾讯、小米等互联网公司。

智谱曾表示,2025年将标志着智谱的开源元年,公司将迅速推出基座模型、推理模型、多模态模型和智能体等全新大模型,并将其开源。

如今,智谱终于实现了开源最强模型的目标,这得益于GLM模型在参数效率和强化训练流程等方面的技术优势。

首先,GLM-4.5和GLM-4.5-Air采用了类似的训练流程,首先在15万亿token的通用数据上进行了预训练,而后在代码、推理以及智能体等领域的8万亿token数据上进行了针对性训练,最后通过强化学习进一步提升模型的推理、代码和智能体能力。

其次,尽管GLM-4.5的参数量仅为DeepSeek-R1的50%和Kimi-K2的三分之一,但在多个基准测试中表现更加突出。同时,API的价格仅为Claude的1/10,输入每百万tokens仅需0.8元,输出每百万tokens为2元。此外,高速版本的实测生成速度超过100 tokens/秒,支持低延迟和高并发的实际应用需求,兼顾了成本效益与用户体验。

最后,在评测方面,GLM-4.5的基准和真实场景表现均十分出色。在包括MMLU Pro等12个评测基准中,GLM-4.5取得了优秀成绩,全球模型第一为OpenAI o3(65.0),第二为xAI Grok 4(63.6),第三为GLM-4.5(63.2),超越了Kimi K2(53.1)和DeepSeek R1(55.9);在真实评测中,GLM-4.5在52个编程开发任务中展现出竞争优势,虽然稍逊于Claude-4-Sonnet,但在工具调用的可靠性和任务完成度方面表现优异,大部分场景中可达到替代效果,能够编写较为复杂的应用、游戏和交互网页等。

目前,GLM-4.5已对外开源。智谱表示,公司将继续发布更为详细的技术报告。

实际上,除了智谱GLM-4.5外,今晚阿里也推出了新的开源模型——电影级视频生成模型通义万相Wan2.2,能够将光影、色彩和镜头语言三大电影美学元素融入模型,灵活组合60多个直观可控的参数,显著提升电影级画面的制作效率;而上周,阿里AI连续发布了Qwen 3最新基础模型(非思考版)、Qwen 3推理模型和AI编程模型Qwen3-Coder,它们分别在基础模型、推理模型和编程模型等主流领域获得全球开源冠军;阶跃星辰在WAIC期间发布的Step 3模型则是公司首个全尺寸、原生多模态推理模型,兼顾模型效果与推理成本,采用MoE架构,总参数量为3210亿,激活参数量为380亿。

即将来临:OpenAI的GPT-5模型与全球AI行业新格局

据最新消息,OpenAI计划推出其最强大的闭源模型GPT-5,预计最快将在七月底正式发布。此版本有望与Sora 2世界模型相结合,实现多模态理解的无缝整合。

在7月28日,一位来自人工智能行业的专家向我透露,随着中国的多种大模型逐渐向开源迈进,硅谷的模型开发则开始趋向闭源。这一趋势表明,国内开源模型的发展将为AI行业带来更多积极影响,也意味着全球基础大模型领域可能会经历一场新的“洗牌”。

(本文首发于钛媒体App,作者|林志佳,编辑|盖虹达)

来源:今日头条
原文标题:刚刚!智谱开源3550亿参数GLM-4.5模型,多项性能或超越Kimi K2成全球第三 – 今日头条
声明:
文章来自网络收集后经过ai改写发布,如不小心侵犯了您的权益,请联系本站删除,给您带来困扰,深表歉意!
正文完
 0
小智
版权声明:本站原创文章,由 小智 于2025-11-04发表,共计2482字。
转载说明:除特殊说明外本站文章皆由CC-4.0协议发布,转载请注明出处。
使用智语AI写作智能工具,您将体验到ChatGPT中文版的强大功能。无论是撰写专业文章,还是创作引人入胜的故事,AI助手都能为您提供丰富的素材和创意,激发您的写作灵感。您只需输入几个关键词或主题,AI便会迅速为您生成相关内容,让您在短时间内完成写作任务。
利用AI智能写作工具,轻松生成高质量内容。无论是文章、博客还是创意写作,我们的免费 AI 助手都能帮助你提升写作效率,激发灵感。来智语AI体验 ChatGPT中文版,开启你的智能写作之旅!
利用智语AI写作工具,轻松生成高质量内容。无论是文章、博客还是创意写作,我们的免费 AI 助手都能帮助你提升写作效ai率,激发灵感。来智语AI体验ChatGPT中文版,开启你的智能ai写作之旅!