阿里推出通义千问Qwen3-Max正式版，参数突破万亿，引领AI新潮流！

没有评论

共计 1255 个字符，预计需要花费 4 分钟才能阅读完成。

IT之家于9月24日发布消息，阿里云在推出Qwen3-2507系列后，今天正式发布了Qwen3-Max，这是通义团队迄今为止最为庞大和强大的模型。

Qwen3-Max-Instruct的正式版在智能体和代码能力方面实现了显著的提升。在各类基准测试中，包括知识、推理、编程、指令遵循、人类偏好对齐、智能体任务及多语言理解等领域，该模型的表现均处于行业领先水平。

通义团队指出，目前仍在训练的Qwen3-Max-Thinking展现了极大的潜力，预计不久将向公众发布。该“思考”版本在结合工具使用的情况下，在AIME 25、HMMT等高难度推理测试中取得了100%的准确率。

IT之家提供了官方链接：

QwenChat：chat.qwen.ai
阿里云百炼：
https://help.aliyun.com/zh/model-studio/models#qwen-max-cn-bj

根据阿里的介绍，Qwen3-Max模型的参数总量超过1T，预训练使用了36T的tokens。该模型沿用Qwen3系列的设计架构，采用了global-batch load balancing loss。

训练稳定性：得益于Qwen3的MoE模型设计，使得Qwen3-Max的预训练loss保持稳定且平滑。训练过程连续，无任何loss尖刺，且未采用训练回退或数据分布调整策略。
训练高效性：在PAI-FlashMoE的多级流水并行策略优化下，Qwen3-Max-Base的训练效率显著提高，其MFU相比Qwen2.5-Max-Base提升了30%。在长序列训练场景中，ChunkFlow策略的采用使吞吐量提升了3倍，可支持Qwen3-Max进行1M长上下文的训练。同时，通过SanityCheck、EasyCheckpoint及调度链路优化等多种手段，Qwen3-Max在超大规模集群上因硬件故障造成的时间损失减少至Qwen2.5-Max的五分之一。

目前，Qwen3-Max-Instruct的预览版已经在LMArena文本排行榜上名列全球前三。正式版则在能力上更进一步，尤其在代码生成与智能体表现方面尤为突出。

在针对现实编程挑战的基准测试SWE-Bench Verified中，Qwen3-Max-Instruct获得了69.6分的优异成绩，稳居全球顶尖模型之列。

并且，在评估智能体工具调用能力的严苛基准Tau2-Bench中，Qwen3-Max-Instruct的表现亮眼，得分达到74.8，超越了Claude Opus 4和DeepSeek-V3.1。

Qwen3-Max的推理增强版本——Qwen3-Max-Thinking，通过集成代码解释器及运用并行测试技术，展现出前所未有的推理能力。在极具挑战性的数学推理基准测试AIME 25和HMMT中，均取得满分。

来源：今日头条

原文标题：参数超万亿：阿里发布通义千问最强 AI 大模型 Qwen3-Max 正式版 – 今日头条

原文链接：https://toutiao.com/group/7553482976404570634/

正文完

AI技术 Qwen3-Max 人工智能最新发布阿里

发表至：通义千问

2025-10-01

转载说明：除特殊说明外本站文章皆由CC-4.0协议发布，转载请注明出处。

使用智语AI写作智能工具，您将体验到ChatGPT中文版的强大功能。无论是撰写专业文章，还是创作引人入胜的故事，AI助手都能为您提供丰富的素材和创意，激发您的写作灵感。您只需输入几个关键词或主题，AI便会迅速为您生成相关内容，让您在短时间内完成写作任务。
利用AI智能写作工具，轻松生成高质量内容。无论是文章、博客还是创意写作，我们的免费 AI 助手都能帮助你提升写作效率，激发灵感。来智语AI体验 ChatGPT中文版，开启你的智能写作之旅！

阿里CEO吴泳铭：通义千问API调用费用一年内暴跌97%！

阿里通义千问Qwen3-Max官网上线深度思考功能，开启智能对话新纪元！

阿里通义千问Qwen3-Max全新深度思考模式上线，AI动态资讯速递！

阿里云自研“通义千问”大模型重磅发布，深度测评揭开神秘面纱！

通义千问发布AgentScope1.0：全新开源智能体震撼上线！

千问3全面上线，夸克即将加盟通义App！

阿里通义千问：Qwen Code每日免费调用高达2000次，快来体验！

通义千问AgentScope1.0震撼上线，开源智能体全新登场！

通义千问发布Qwen3-Max模型，宣称超越极限的强劲实力！

阿里推出开源AI编程模型Qwen3-Coder，引领技术新潮流！