共计 1058 个字符,预计需要花费 3 分钟才能阅读完成。
据IT之家7月31日报道,阿里通义千问今天正式推出了全新的推理模型Qwen3-30B-A3B-Thinking-2507。与4月29日发布的Qwen3-30-A3B模型相比,这一新模型在推理能力、通用能力以及上下文处理长度等方面都有了显著提升:

-
在专注于数学能力的AIME25评测中,新模型获得了85.0的优异成绩,而在代码能力测试LiveCodeBench v6中,则取得了66.0的分数,这两项核心推理能力均超越了Gemini2.5-Flash(thinking)和Qwen3-235B-A22B(thinking);此外,新模型在知识水平(GPQA、MMLU-Pro)方面也有了显著进步。
-
在写作能力(WritingBench)、智能体能力(BFCL-v3)、多轮对话及多语言指令遵循(MultiIF)等通用能力评测中,
Qwen3-30B-A3B-Thinking-2507也表现超越了Gemini2.5-Flash(thinking)和Qwen3-235B-A22B(thinking)。 -
该模型具备更强的上下文理解能力,原生支持256K tokens,并且可扩展到1M tokens。


此外,新模型的思考长度(thinking length)也得到了增加,官方建议在处理高度复杂的推理任务时,适当延长思考预算,以便更好地发挥其潜力。
官方表示,目前
Qwen3-30B-A3B-Thinking-2507已经在魔搭社区和HuggingFace上开源,其轻量化的特性使得本地部署在消费级硬件上变得非常容易;与此同时,该模型也已在Qwen Chat平台上同步上线。
Qwen3-30B-A3B-Thinking-2507模型重磅来袭,轻松实现本地部署
在当前的技术环境下,Qwen3-30B-A3B-Thinking-2507模型的发布引发了广泛关注。官方宣布,该模型现已在魔搭社区及HuggingFace平台上开源,这一举措令人振奋。由于其轻量化设计,用户在消费级硬件上部署这一模型变得相对简单,极大地拓宽了应用的可能性。同时,Qwen Chat平台也同步推出了该模型,进一步提升了其可用性和影响力。

