阿里通义千问发布全新推理模型Qwen3-30B-A3B-Thinking-2507,助力智能进化!

共计 1058 个字符,预计需要花费 3 分钟才能阅读完成。

据IT之家7月31日报道,阿里通义千问今天正式推出了全新的推理模型Qwen3-30B-A3B-Thinking-2507。与4月29日发布的Qwen3-30-A3B模型相比,这一新模型在推理能力、通用能力以及上下文处理长度等方面都有了显著提升:

  • 在专注于数学能力的AIME25评测中,新模型获得了85.0的优异成绩,而在代码能力测试LiveCodeBench v6中,则取得了66.0的分数,这两项核心推理能力均超越了Gemini2.5-Flash(thinking)和Qwen3-235B-A22B(thinking);此外,新模型在知识水平(GPQA、MMLU-Pro)方面也有了显著进步。

  • 在写作能力(WritingBench)、智能体能力(BFCL-v3)、多轮对话及多语言指令遵循(MultiIF)等通用能力评测中,
    Qwen3-30B-A3B-Thinking-2507也表现超越了Gemini2.5-Flash(thinking)和Qwen3-235B-A22B(thinking)。

  • 该模型具备更强的上下文理解能力,原生支持256K tokens,并且可扩展到1M tokens

此外,新模型的思考长度(thinking length)也得到了增加,官方建议在处理高度复杂的推理任务时,适当延长思考预算,以便更好地发挥其潜力。

官方表示,目前
Qwen3-30B-A3B-Thinking-2507已经在魔搭社区和HuggingFace上开源,其轻量化的特性使得本地部署在消费级硬件上变得非常容易;与此同时,该模型也已在Qwen Chat平台上同步上线。

Qwen3-30B-A3B-Thinking-2507模型重磅来袭,轻松实现本地部署

在当前的技术环境下,Qwen3-30B-A3B-Thinking-2507模型的发布引发了广泛关注。官方宣布,该模型现已在魔搭社区及HuggingFace平台上开源,这一举措令人振奋。由于其轻量化设计,用户在消费级硬件上部署这一模型变得相对简单,极大地拓宽了应用的可能性。同时,Qwen Chat平台也同步推出了该模型,进一步提升了其可用性和影响力。

来源:今日头条
原文标题:阿里通义千问推出全新推理模型Qwen3-30B-A3B-Thinking-2507 – 今日头条
声明:
文章来自网络收集后经过ai改写发布,如不小心侵犯了您的权益,请联系本站删除,给您带来困扰,深表歉意!
正文完
 0
小智
版权声明:本站原创文章,由 小智 于2025-11-11发表,共计1058字。
转载说明:除特殊说明外本站文章皆由CC-4.0协议发布,转载请注明出处。
使用智语AI写作智能工具,您将体验到ChatGPT中文版的强大功能。无论是撰写专业文章,还是创作引人入胜的故事,AI助手都能为您提供丰富的素材和创意,激发您的写作灵感。您只需输入几个关键词或主题,AI便会迅速为您生成相关内容,让您在短时间内完成写作任务。
利用AI智能写作工具,轻松生成高质量内容。无论是文章、博客还是创意写作,我们的免费 AI 助手都能帮助你提升写作效率,激发灵感。来智语AI体验 ChatGPT中文版,开启你的智能写作之旅!
利用智语AI写作工具,轻松生成高质量内容。无论是文章、博客还是创意写作,我们的免费 AI 助手都能帮助你提升写作效ai率,激发灵感。来智语AI体验ChatGPT中文版,开启你的智能ai写作之旅!