阿里推出通义千问Qwen3-Max:万亿参数AI大模型震撼发布!

共计 1069 个字符,预计需要花费 3 分钟才能阅读完成。

【最新科技动态】 9 月 24 日消息,阿里巴巴的通义千问团队隆重推出了 Qwen3-Max 模型,这一版本是该团队迄今为止最大的人工智能模型,具备卓越的能力。该模型总参数数目超过 1T,预训练所用的数据量高达 36T tokens。

Qwen3-Max 一共推出了三个不同的版本:Base、Instruct 和 Thinking 思。其中,Qwen3-Max-Instruct 的正式版已在 Qwen Chat 平台上线,并在阿里云百炼上提供 API 服务。

根据官方信息,Qwen3-Max-Instruct 的预览版在 LMArena 文本排行榜上名列全球前三,甚至超越了 GPT-5-Chat。正式发布的版本在代码处理和智能体能力方面有了显著提升,在知识覆盖、推理能力、编程技能、指令响应、人类偏好对齐、智能体任务处理以及多语言理解等多个基准测试中均表现出色,达到了业内领先水平。

在专注于解决实际编程问题的基准测试 SWE-Bench Verified 中,Qwen3-Max-Instruct 取得了令人瞩目的 69.6 分。在评估智能体工具应用能力的 Tau2-Bench 上,它以 74.8 的分数超越了 Claude Opus 4 和 DeepSeek-V3.1。

作为推理增强的版本,Qwen3-Max-Thinking 尽管仍在训练阶段,但已经展现出惊人的潜力。该版本通过集成代码解析器,运用并行测试计算技术,展示了卓越的推理能力。在复杂的数学推理基准测试中,比如 AIME 25 和 HMMT,Qwen3-Max-Thinking 均获得了满分,充分表明其在复杂逻辑推理方面的突出表现。

Qwen3-Max 继承了 Qwen3 系列的模型架构设计理念,采用了 global-batch 负载均衡损失函数。这种架构确保了训练过程的稳定性,避免了 loss 尖刺的出现。在训练效率方面,通过 PAI-FlashMoE 多级流水并行策略的优化,Qwen3-Max-Base 的模型 MFU 相比于 Qwen2.5-Max-Base 提升了 30%。此外,它还支持 1M 长上下文的训练,在长序列训练的场景中表现尤为出色。

目前,用户可通过 Qwen Chat 官网与 Qwen3-Max-Instruct 模型进行互动,其 API 也已对外开放。这款拥有万亿参数的大模型的正式发布,标志着中国在全球 AI 大模型领域的竞争力进一步增强,能够为各行各业提供更为强大的人工智能支持。

来源:今日头条
原文标题: 阿里发布通义千问 Qwen3-Max:万亿参数 AI 大模型登场 – 今日头条
正文完
 0
小智
版权声明:本站原创文章,由 小智 于2025-10-01发表,共计1069字。
转载说明:除特殊说明外本站文章皆由CC-4.0协议发布,转载请注明出处。
使用智语AI写作智能工具,您将体验到ChatGPT中文版的强大功能。无论是撰写专业文章,还是创作引人入胜的故事,AI助手都能为您提供丰富的素材和创意,激发您的写作灵感。您只需输入几个关键词或主题,AI便会迅速为您生成相关内容,让您在短时间内完成写作任务。
利用AI智能写作工具,轻松生成高质量内容。无论是文章、博客还是创意写作,我们的免费 AI 助手都能帮助你提升写作效率,激发灵感。来智语AI体验 ChatGPT中文版,开启你的智能写作之旅!
利用智语AI写作工具,轻松生成高质量内容。无论是文章、博客还是创意写作,我们的免费 AI 助手都能帮助你提升写作效ai率,激发灵感。来智语AI体验ChatGPT中文版,开启你的智能ai写作之旅!