共计 778 个字符,预计需要花费 2 分钟才能阅读完成。
根据IT之家8月7日的报道,通义千问在8月6日发布公告,推出了两个新模型——Qwen3-4B-Instruct-2507和Qwen3-4B-Thinking-2507,标志着性能的显著提升。
官方指出,SML(小型语言模型)在Agentic AI的发展中具有重要意义。新推出的“2507”版本Qwen3-4B模型不仅体积较小,而且性能卓越,特别适合在手机等边缘设备上进行部署。

IT之家引用博文的信息指出,Qwen3-4B-Instruct-2507在非推理领域的通用能力显著增强,旨在成为一个更为全面的端侧解决方案。
这款模型掌握的语言和长尾知识更加丰富,能够将上下文理解扩展至256K,即使是小型模型也能处理较长的文本。其通用能力已超越了闭源的小型模型GPT-4.1-nano,并与同规模的Qwen3-30B-A3B(非推理)性能相当。
官方表示,这一模型更像一位高效的“执行专家”,能够快速响应指令,特别适合于内容创作和工具调用等场景。
在推理领域方面,Qwen3-4B-Thinking-2507的推理能力得到了极大的提升,其在AIME25测试中获得了高达81.3分的优异成绩。该模型的推理表现可与中型模型Qwen3-30B-Thinking相媲美,在聚焦数学能力的AIME25评测中,以4B的参数量取得了惊人的81.3分。

官方称这一模型更像是一位严谨的“学术专家”,能够针对复杂问题进行深入推理,并逐步完成任务,展现出更高的可靠性。

