共计 752 个字符,预计需要花费 2 分钟才能阅读完成。
9月24日的消息显示,通义千问团队今天发布了Qwen3-Max,这一新模型号称是迄今为止最大的、功能最强的版本。
目前,Qwen3-Max-Instruct的预览版在LMArena文本排行榜中名列第三,超过了GPT-5-Chat的成绩。
正式版在代码生成和智能体功能方面显著增强,并在知识、推理、编程、指令遵循、人类偏好对齐、智能体任务以及多语言理解等领域的基准测试中表现出色,达到行业领先水平。
Qwen3-Max的总参数量超过1万亿,预训练过程中使用了36万亿tokens。该模型的结构延续了Qwen3系列的设计理念,并采用了我们提出的global-batch load balancing loss。
在LMArena文本排行榜上,Qwen3-Max-Instruct的预览版稳居全球前列。正式发布后,其能力得到进一步提升,尤其是在代码生成及智能体表现上表现优异。在针对现实编程难题的基准测试SWE-Bench Verified中,Qwen3-Max-Instruct取得了高达69.6的优秀分数,位列全球顶尖模型之中。
Qwen3-Max的推理增强版本——Qwen3-Max-Thinking,通过集成代码解释器和应用并行测试计算技术,展现出前所未有的推理能力,尤其在极具挑战性的数学推理基准测试AIME 25和HMMT中均取得满分。(AI普瑞斯编译)
获取更多AI资讯请访问:
http://www.aipress.com.cn/
原文链接:
http://www.aipress.com.cn/news/details?id=70640