阿里推出全新开源通义千问模型Qwen3,掀起智能革命!

共计 1120 个字符,预计需要花费 3 分钟才能阅读完成。

在4月29日的凌晨时分,阿里巴巴正式推出了其新一代通义千问模型Qwen3(简称千问3)。根据阿里巴巴的介绍,千问3是国内首个“混合推理模型”,将“快思考”与“慢思考”融合在同一模型中。该模型能够在面对简单需求时快速响应,使用低算力即可“秒回”答案,而在处理复杂问题时则进行多步骤的深入思考,显著降低了算力的消耗。在由加州大学伯克利分校、麻省理工学院和康奈尔大学的研究人员开发的LiveCodeBench大语言模型评测中,千问3的表现超越了R1、OpenAI-o1等世界顶尖模型,成为全球最强的开源模型。

阿里巴巴相关负责人指出,千问3采用了混合专家(MoE)架构,参数总量达到了235B,仅为DeepSeek-R1的三分之一,激活时所需的参数量为22B。千问3在预训练阶段使用了36T的数据量,并在后期通过多轮强化学习将非思考模式与思考模型无缝整合。该模型在推理、指令遵循、工具调用以及多语言能力等多个方面均有显著提升,创造了国产模型和全球开源模型的新高。在奥数AIME25测评中,千问3获得了81.5分,刷新了开源纪录;在LiveCodeBench评测中,该模型的得分突破了70分,成绩甚至超越了Grok3;在ArenaHard测评中,千问3以95.6分的成绩超过了OpenAI-o1和DeepSeek-R1。与此同时,千问3的部署成本也显著降低,只需4张H20便可部署其完整版本,显存占用仅为同类高性能模型的三分之一。

千问3性能图

千问3提供多种模型版本,包括2款30B和235B的MoE模型,以及0.6B、1.7B、4B、8B、14B、32B等6款密集模型。其中,千问3的30B参数MoE模型实现了超过10倍的性能提升,激活仅需3B便可匹敌上代Qwen2.5-32B的表现;而千问3的稠密模型也在不断突破,32B版本的千问3能够以一半的参数量超越Qwen2.5-72B的性能。

值得一提的是,千问3首次支持超过119种语言,开源后,用户可在魔搭社区、HuggingFace等平台下载并进行商业使用。同时,用户也可以通过阿里云百炼调用千问3的API服务,个人用户则可以在通义APP上体验千问3的功能。

当前,阿里通义已开源超过200个模型,全球下载量超过3亿次,千问系列衍生模型数量已超过10万个,现已超越美国的Llama,成为全球首个开源模型的领导者。

来源:今日头条
原文标题:阿里开源新一代通义千问模型Qwen3 – 今日头条
声明:
文章来自网络收集后经过ai改写发布,如不小心侵犯了您的权益,请联系本站删除,给您带来困扰,深表歉意!
正文完
 0
小智
版权声明:本站原创文章,由 小智 于2025-11-13发表,共计1120字。
转载说明:除特殊说明外本站文章皆由CC-4.0协议发布,转载请注明出处。
使用智语AI写作智能工具,您将体验到ChatGPT中文版的强大功能。无论是撰写专业文章,还是创作引人入胜的故事,AI助手都能为您提供丰富的素材和创意,激发您的写作灵感。您只需输入几个关键词或主题,AI便会迅速为您生成相关内容,让您在短时间内完成写作任务。
利用AI智能写作工具,轻松生成高质量内容。无论是文章、博客还是创意写作,我们的免费 AI 助手都能帮助你提升写作效率,激发灵感。来智语AI体验 ChatGPT中文版,开启你的智能写作之旅!
利用智语AI写作工具,轻松生成高质量内容。无论是文章、博客还是创意写作,我们的免费 AI 助手都能帮助你提升写作效ai率,激发灵感。来智语AI体验ChatGPT中文版,开启你的智能ai写作之旅!