阿里推出通义千问Qwen3-Max：万亿参数AI大模型震撼发布！

共计 1069 个字符，预计需要花费 3 分钟才能阅读完成。

【最新科技动态】 9 月 24 日消息，阿里巴巴的通义千问团队隆重推出了 Qwen3-Max 模型，这一版本是该团队迄今为止最大的人工智能模型，具备卓越的能力。该模型总参数数目超过 1T，预训练所用的数据量高达 36T tokens。

Qwen3-Max 一共推出了三个不同的版本：Base、Instruct 和 Thinking 思。其中，Qwen3-Max-Instruct 的正式版已在 Qwen Chat 平台上线，并在阿里云百炼上提供 API 服务。

根据官方信息，Qwen3-Max-Instruct 的预览版在 LMArena 文本排行榜上名列全球前三，甚至超越了 GPT-5-Chat。正式发布的版本在代码处理和智能体能力方面有了显著提升，在知识覆盖、推理能力、编程技能、指令响应、人类偏好对齐、智能体任务处理以及多语言理解等多个基准测试中均表现出色，达到了业内领先水平。

在专注于解决实际编程问题的基准测试 SWE-Bench Verified 中，Qwen3-Max-Instruct 取得了令人瞩目的 69.6 分。在评估智能体工具应用能力的 Tau2-Bench 上，它以 74.8 的分数超越了 Claude Opus 4 和 DeepSeek-V3.1。

作为推理增强的版本，Qwen3-Max-Thinking 尽管仍在训练阶段，但已经展现出惊人的潜力。该版本通过集成代码解析器，运用并行测试计算技术，展示了卓越的推理能力。在复杂的数学推理基准测试中，比如 AIME 25 和 HMMT，Qwen3-Max-Thinking 均获得了满分，充分表明其在复杂逻辑推理方面的突出表现。

Qwen3-Max 继承了 Qwen3 系列的模型架构设计理念，采用了 global-batch 负载均衡损失函数。这种架构确保了训练过程的稳定性，避免了 loss 尖刺的出现。在训练效率方面，通过 PAI-FlashMoE 多级流水并行策略的优化，Qwen3-Max-Base 的模型 MFU 相比于 Qwen2.5-Max-Base 提升了 30%。此外，它还支持 1M 长上下文的训练，在长序列训练的场景中表现尤为出色。

目前，用户可通过 Qwen Chat 官网与 Qwen3-Max-Instruct 模型进行互动，其 API 也已对外开放。这款拥有万亿参数的大模型的正式发布，标志着中国在全球 AI 大模型领域的竞争力进一步增强，能够为各行各业提供更为强大的人工智能支持。

来源：今日头条

原文标题：阿里发布通义千问 Qwen3-Max：万亿参数 AI 大模型登场 – 今日头条

原文链接：https://toutiao.com/group/7553506322910577167/

正文完