共计 1069 个字符,预计需要花费 3 分钟才能阅读完成。
【最新科技动态】 9 月 24 日消息,阿里巴巴的通义千问团队隆重推出了 Qwen3-Max 模型,这一版本是该团队迄今为止最大的人工智能模型,具备卓越的能力。该模型总参数数目超过 1T,预训练所用的数据量高达 36T tokens。
Qwen3-Max 一共推出了三个不同的版本:Base、Instruct 和 Thinking 思。其中,Qwen3-Max-Instruct 的正式版已在 Qwen Chat 平台上线,并在阿里云百炼上提供 API 服务。
根据官方信息,Qwen3-Max-Instruct 的预览版在 LMArena 文本排行榜上名列全球前三,甚至超越了 GPT-5-Chat。正式发布的版本在代码处理和智能体能力方面有了显著提升,在知识覆盖、推理能力、编程技能、指令响应、人类偏好对齐、智能体任务处理以及多语言理解等多个基准测试中均表现出色,达到了业内领先水平。


在专注于解决实际编程问题的基准测试 SWE-Bench Verified 中,Qwen3-Max-Instruct 取得了令人瞩目的 69.6 分。在评估智能体工具应用能力的 Tau2-Bench 上,它以 74.8 的分数超越了 Claude Opus 4 和 DeepSeek-V3.1。

作为推理增强的版本,Qwen3-Max-Thinking 尽管仍在训练阶段,但已经展现出惊人的潜力。该版本通过集成代码解析器,运用并行测试计算技术,展示了卓越的推理能力。在复杂的数学推理基准测试中,比如 AIME 25 和 HMMT,Qwen3-Max-Thinking 均获得了满分,充分表明其在复杂逻辑推理方面的突出表现。
Qwen3-Max 继承了 Qwen3 系列的模型架构设计理念,采用了 global-batch 负载均衡损失函数。这种架构确保了训练过程的稳定性,避免了 loss 尖刺的出现。在训练效率方面,通过 PAI-FlashMoE 多级流水并行策略的优化,Qwen3-Max-Base 的模型 MFU 相比于 Qwen2.5-Max-Base 提升了 30%。此外,它还支持 1M 长上下文的训练,在长序列训练的场景中表现尤为出色。
目前,用户可通过 Qwen Chat 官网与 Qwen3-Max-Instruct 模型进行互动,其 API 也已对外开放。这款拥有万亿参数的大模型的正式发布,标志着中国在全球 AI 大模型领域的竞争力进一步增强,能够为各行各业提供更为强大的人工智能支持。