通义千问Qwen3全面升级：性能超越Kimi K2与DeepSeek V3，技术亮点大揭秘！

共计 1266 个字符，预计需要花费 4 分钟才能阅读完成。

阿里巴巴重磅推出 Qwen3-235B-A22B-Instruct-2507-FP8 模型，AI 能力再创新高

在 7 月 22 日的凌晨，阿里巴巴的通义千问团队发布了其旗舰模型 Qwen3 的重要更新，推出了 Qwen3-235B-A22B-Instruct-2507-FP8，带来了非思考模式（Non-thinking）的新版本。

这一新版本在多项关键能力上取得了显著进步，超越了 Kimi-K2 等顶级开源模型，甚至在某些方面领先于 Claude-Opus4-Non-thinking 等顶级闭源模型。

这次升级的表现究竟有多强大？

根据官方的数据，新模型的通用能力得到了全面的提升，多个权威评测中均表现优异：

在指令遵循、逻辑推理、文本理解、数学、科学、编程及工具使用等领域，Qwen3-235B-A22B-Instruct-2507-FP8 在 GQPA（知识）、AIME25（数学）、LiveCodeBench（编程）、Arena-Hard（人类偏好对齐）、BFCL（Agent 能力）等测评中均超越了 Kimi-K2、DeepSeek-V3 等顶级开源模型，以及 Claude-Opus4-Non-thinking 等优秀闭源模型。

特别值得注意的是，此次更新的 Qwen3 模型在 Agent 能力方面表现尤为出色：在 BFCL（Agent 能力）测评中取得了卓越成绩。这表明该模型在理解复杂指令、自主规划以及工具调用等任务上，达到了新的高度。“主打 Agent”将成为未来 AI 应用的核心竞争力。

除了出色的性能评分，此次更新还带来了三大“体感”升级：

– 模型在多语言长尾知识的覆盖上取得了显著进展。
– 在主观及开放性任务中，模型显著提升了与用户偏好的契合度，能够提供更具实用性的回复，生成更高质量的文本。
– 长文本处理能力提升至 256K，进一步增强了上下文理解能力。

告别“混合思维”，分离训练的强大之处何在？

此次最为核心的变化在于技术路线的革新。

通义千问团队宣布，他们将正式告别以往的“混合思维模式”，转向全新的“分离训练”时代。这一新的方法将直接用于回答的 Instruct 模型和用于复杂思考的 Thinking 模型分别进行独立训练。

简单来说，就是让“快速思考”和“慢速思考”各自发挥作用，从而在各自的领域达到最佳表现。

此次发布的 Qwen3-235B-A22B-Instruct-2507-FP8，正是“快速思考”方向下的最新成果。它以非思考模式为核心，旨在实现指令遵循、文本理解和知识问答等任务的更快、更精准、更强大。

https://baijiahao.baidu.com/s?id=1838305117657836324&wfr=spider&for=pc

来源：知乎

原文标题：通义千问更新 Qwen3 升级版，性能超越 Kimi K2 和 DeepSeek V3，有哪些技术亮点？– 知乎

原文链接：https://www.zhihu.com/question/1930932168365925991

声明：

文章来自网络收集后经过 ai 改写发布，如不小心侵犯了您的权益，请联系本站删除，给您带来困扰，深表歉意！

正文完

AI模型 Qwen3 性能对比技术升级通义千问

发表至： chatgpt知识

2025-10-06

转载说明：除特殊说明外本站文章皆由CC-4.0协议发布，转载请注明出处。

使用智语AI写作智能工具，您将体验到ChatGPT中文版的强大功能。无论是撰写专业文章，还是创作引人入胜的故事，AI助手都能为您提供丰富的素材和创意，激发您的写作灵感。您只需输入几个关键词或主题，AI便会迅速为您生成相关内容，让您在短时间内完成写作任务。
利用AI智能写作工具，轻松生成高质量内容。无论是文章、博客还是创意写作，我们的免费 AI 助手都能帮助你提升写作效率，激发灵感。来智语AI体验 ChatGPT中文版，开启你的智能写作之旅！

奥特曼直言：GPT-5发布让一切变得复杂！

探索ChatGPT4.0：解码人工智能专业就业前景与应用方向

阿里新发布Qwen3-Coder编程模型，性能直逼全球顶尖Claude4，技术揭秘与使用体验全解析！

人工智能会否取代人类？ChatGPT最新应用与未来发展前景的深入探讨

OpenAI: 推动人工智能的全面发展

探索ChatGPT的多样应用：从网页版到AI聊天机器人的全面指南

New Chat官网，让您与世界无缝交流的全新助手

Chat4.0收费策略解析

百度吴甜揭晓文心一言用户突破4.3亿的最新进展！

告别Sora！探索这些强劲的国产AI视频大模型，实力不容小觑！