共计 1215 个字符,预计需要花费 4 分钟才能阅读完成。
新京报贝壳财经讯(记者罗亦丹)近期,国内人工智能大模型制造商在编程领域的竞争愈发激烈。7月23日,阿里巴巴正式推出了全新的通义千问AI编程大模型Qwen3-Coder,该公司通过微信公众平台表示:“这是我们迄今为止最具代理能力的代码模型。”
Qwen3-Coder是千问系列中的首个采用混合专家MoE架构的代码模型,拥有480亿个参数,其中35亿参数可激活,支持原生的256K token上下文,并可扩展至1M长度。该模型在7.5T数据集中进行了预训练,数据中代码占比达到70%。在后期训练中,Qwen3-Coder通过强化学习提升了编程任务和智能体任务的能力,最终实现了通用能力、代码能力以及Agent能力的显著提升。在WebArena和BFCL等Agent能力的评测中,Qwen3-Coder刷新了开源模型的记录,超越了GPT4.1;在SWE-Bench评测中,该模型在自主规划编程任务方面表现优异,达到了开源最佳效果,能够与Claude4相媲美。这一切表明,Qwen3-Coder的编程能力已经位居全球开源模型之巅,超越了GPT4.1等闭源模型,齐肩“全球最强”编程模型Claude4。
阿里巴巴表示,Qwen3-Coder在代码能力与Agent调用能力方面取得了显著进展,特别擅长处理多步骤的复杂任务。该模型能够全面掌控任务,智能安排工作,支持多种工具的调用,从而有效解决复杂的编程问题。基于Qwen3-Coder的技术,网页开发、AI搜索及深度研究等智能应用将变得更加高效和智能。实测数据显示,Qwen3-Coder在执行任务时可以调用的工具数量是Claude的多倍,“依靠Qwen3-Coder,初入行的程序员一天内便能完成资深程序员一周的工作,而创建一个品牌官网最快仅需5分钟。”
Qwen3-Coder已在魔搭社区和HuggingFace等平台上开源,全球开发者均可免费下载使用。此外,Qwen3-Coder即将接入阿里巴巴的AI编程产品通义灵码,相关API已上线阿里云百炼。为了帮助开发者更好地利用Qwen3-Coder,通义团队还推出了一款命令行工具Qwen Code,充分发挥Qwen3-Coder在代理式编程方面的潜力。同时,Qwen3-Coder的API能够与Claude Code、Cline等工具进行协同工作。
贝壳财经记者注意到,阿里巴巴CEO吴泳铭在2024年9月的云栖大会上提到:“大模型技术快速迭代,技术的可用性显著提升。去年,大模型仅能帮助程序员编写简单代码,而如今已经能够直接理解需求,完成复杂编程任务。”此次以阿里巴巴的名义发布Qwen3-Coder,显然表明了阿里巴巴集团对该产品的高度重视。
编辑 杨娟娟
校对 杨利