蚂蚁李建国:AI写代码已达L2.5,突破L3将使50%编程岗位被取代

共计 4332 个字符,预计需要花费 11 分钟才能阅读完成。

AI 编程的变革:未来的代码生成与企业发展 白交 发自 凹非寺 量子位 | 公众号 QbitAI超过 70% 的代码问题,仅依靠基础大模型无法解决;预计在未来 3 到 5 年内,人工智能将取代人类的一半编程工作,部分环节甚至实现完全自动化。蚂蚁集团代码大模型 CodeFuse 的项目负责人李建国表示。目前,人工智能代码生成领域正在快速发展,行业巨头纷纷涌入,AI 程序员频繁出现在企业中;首位 AI 程序员 Devin 被指控存在造假……在这一变革浪潮中,李建国给出了明确的看法。李建国 是谁?他是清华大学的博士,拥有十余年的机器学习与深度学习经验,发表的论文引用次数超过一万。在他的领导下,蚂蚁集团正在积极推动 AI 编程的应用,已有 超过 50% 的程序员 在每周使用 CodeFuse,目前其代码生成的整体采纳率已达 30%,在所有 AI 编程工具中名列前茅,最强的 Copilot 代码采纳率约为 35%。 在开源社区,CodeFuse 的下载量也已接近 170 万次 因此,无论是在学术界的权威性,还是在产业中的实际应用,李建国博士均拥有重要的发言权。在代码生成模型与产品快速发展的背景下,量子位与李建国博士进行了深入的交流。以下是他的核心观点:编写代码在企业研发流程中可能只占不到五分之一,甚至更少;要实现项目级要求,从原子级需求到端到端的渐进模式是可行的;AI 程序员已成为企业运营的新常态 ,这一趋势无法逆转; 超过 70% 的代码问题,单靠基础大模型难以解决;当前的自然语言编程仍处于 L2.5 阶段,未来 3 到 4 年有望达到 L3,甚至接近 L4 水平。与前后端软件工程师相比,AI 全栈工程师的需求更为迫切 当前的代码生成变革面临的挑战包括:端到端代码生成能力、Agent 推理能力、复杂需求拆解、跨模态交互以及安全性和可靠性。

编写代码在研发过程中的比重不足五分之一

首先,程序员行业的历史并不悠久,自 20 世纪 50 年代起算,大约只有七八十年的发展历程。随着技术的不断进步,编程工具也在不断创新升级(从打孔到 VI 编辑器,再到集成开发环境以及辅助编程工具),程序员的工作效率有了显著提高。进入大模型时代后,相关模型和产品的演化速度极快,竞争非常激烈。对于个人开发者而言,AI 编程工具只需完成需求到代码实现的闭环过程,例如 Copilot 这样的工具。他们更关注如何高效满足需求 而从企业的角度来看,更加关注研发流程的整体效率提升,除了代码生成的安全性和可靠性外,测试、构建、发布运维及数据分析等环节同样至关重要。我们希望有一个研发智能体,甚至是一个智能总线(bus),能够与各个 Agent 进行互动,并将任务分配出去——从架构设计到前端实现,再到后端开发,以及安全和功能测试,最终实现持续集成 / 持续部署(CICD)和运维自动化。系统上线后,还应能自动进行运维监控,并分析用户访问量(UV)、页面浏览量(PV)等关键数据。编写代码在整个研发过程中所占的比重可能连五分之一或十分之一都不到 。如果这样的 Agent 能够高效连接所有环节,便能真正提升整体流程的效率。 此外,程序员面临的痛点在于,市面上许多产品的能力仍停留在原子级——单一大模型只能处理 30% 的代码补全,无法解决跨库函数调用等更复杂的问题。基于这样的行业洞察,从去年 9 月开始,我们开源了 CodeFuse,并明确了要 构建全生命周期的代码大模型 的目标。目前,基础模型已发布,我们还在不断开发和开源相关的仓库,涵盖需求设计、编程开发、测试构建、发布运维、数据洞察等多个方面,在 modelscope 和 huggingface 上的 模型下载量已达到 170 万左右 接下来的计划是进行项目级需求的实现,这相当于构建一个全新的系统。这对基础模型提出了更高的要求——自然语言理解的能力至少需达到 GPT- 4 或 GPT-4.5 水平。但根据目前的情况,我们更倾向于采取一种 渐进 式的发展路径。我们的首个里程碑是 解决仓库内及跨仓库的需求实现问题 ,包括 API 调用、服务调用及外部中间件版本更新等问题。 如果能够妥善处理这些问题,将会解决前面提到的 70% 问题中相当一部分(如 20% 的问题),这将显著提高代码的采纳率,并提升用户满意度。实现项目级需求的目标任重道远。我认为,代码基础模型和 Agent 技术必须同步快速进步,才能达成我们的愿景。我们的思路相对审慎,因为就基础模型的要求而言,我认为短期内国内要达到 GPT 水平仍面临不少挑战。

大模型改变软件开发的范式

AI 程序员已成为企业运营的新常态 ,这一趋势势不可挡。无论是像 Devin 这样的 AI 程序员,还是我们提到的全生命周期研发智能体,大模型在整个软件研发中的效率提升都是显而易见的。 过去,当遇到不懂的问题时,人们通常会先去 Google 或百度搜索,而现在,他们可以直接在代码中提问,迅速获得相对精确的答案,采纳后即可使用。我认为这是一种巨大的效率提升,标志着技术的进步。人们可以将更多的时间投入到更具创造性的工作中去。最近,CodeFuse 推出了 图生代码 的功能,用户只需在界面上简单画一个框,就能自动生成对应的代码。过去可能需要编写几百行代码的工作,现在只需一次点击和简单的框选操作就能完成。从产品设计的视角来看,实现 无缝接入和无感体验至关重要 这意味着产品应能够自然融入现有的工作流程中,用户在使用时几乎感觉不到它的存在,从而极大地提升用户体验,推动整个研发流程的创新。例如,我们内部每周有超过一万名活跃用户在使用智能代码生成,许多人甚至没有意识到自己在使用 CodeFuse,在日常使用 IDE 插件和浏览器的过程中,已不知不觉地体验到了我们的产品。我们的目标是服务于整个研发生命周期。如果能够实现这一点,将是一次革命性的成功。AI 编程技术已达 L2.5 阶段 当前,代码生成技术的发展相当于自动驾驶的 L2.5 级,许多企业都处于这一阶段。例如,自动驾驶 L2.5 的功能包括车道保持辅助和前方碰撞预警等,这些功能都是整体系统的一部分。在大型模型的应用中,我们也可以看到类似的功能扩展,如代码解释、注释生成、代码简化和单元测试等。我们的下一个目标是力争在 特定场景下实现 L3 级的完全自动化 ,这一目标是可行的。例如,在持续集成(CICD)环境中,依靠大模型的驱动,能够实现自动化操作,如触发检查、提交代码,甚至生成拉取请求(PR)。 然而,若要实现全面的自动化,前端技术的发展仍需时日,尤其是在复杂项目需求拆解和特定领域的挑战方面,依然存在不少困难。我们预计可能还需要 3 至 5 年的时间,借助万物摩尔定律的推动与整个社区的共同努力,才能取得突破。届时,我们期待从现状迈向一个新的阶段——例如,从 Copilot 演变为 co-worker,目前约 20% 至 30% 的编程任务可以由 AI 替代,未来这一比例有望提升至 50%,甚至某些环节将实现完全自动化,从而让人类能够专注于更具创意的工作。最终,AI 可能成为一个全面的智能代理 。虽然完全取代人类的可能性不大,但在未来 3 至 5 年内,达到 L3 甚至接近 L4 的水平是有可能的。 与自动驾驶技术相似,尽管很多年前就开始讨论 L4 级别的技术,许多人声称已经实现,但实际上许多应用场景仍停留在 L2.5 至 L3 的阶段。要实现全面的自动化,人类在其中仍将扮演重要角色。由此可见,软件工程师的角色正在发生转变。曾几何时,大家可能只关注前端或后端开发,如今,对 AI 全栈工程师的需求愈发迫切 过去的全栈工程师通常意味着同时掌握前端、后端和数据处理,而现在这项角色可能还需要深入理解算法。随着大型模型的发展,前端与后端的工作将会越来越多地借助 AI 协作,开发者因此可以将更多时间用于提升新技能,如深入了解产品、关注用户体验和进行算法创新等。经过对整个领域的深入研究,我发现实现这些目标仍面临诸多挑战,主要体现在五个方面:端到端的代码生成能力 目前基础模型的主要功能是代码补全,但在实际应用中,仅有约 30% 的问题能够通过这一方式解决,剩余的 70% 则需要 实现端到端的代码生成能力,这要求跨文件、跨代码库,甚至跨库与文档库的理解与交互。所谓的端到端,对于一个代码库来说,举个例子,我们需要能够直接调用库中的 API,解决问题(issue),甚至能够复用跨库的中间件能力。然而,单靠基础模型是无法完成这些任务的,我们需要更深入的探索和能力提升。智能代理推理能力 尽管最近 Devin 的演示视频被质疑为造假,备受舆论关注,但我认为这仍然代表了一种技术趋势——如何将定制工具调用与大型模型结合,实现整个工作流程的自动化 。这个问题的解决,尤其是扩展到整个生命周期中,实际上相当复杂,特别是在云后端的开发环境中,各种工具层出不穷。 例如,针对前端应用的工具可能只有天气查询、火车票预定、酒店预订等十几个,但在云后端,可能会有数百个甚至上千个工具,每个工具都有数十个参数需要处理。此外,还面临 需求拆解、跨模态横向交互及安全性和可信性的挑战。尤其是 代码的安全性和可信性 ,如蚂蚁这样的企业级客户需要应对金融级别的高可用性和安全性要求,这无疑是个挑战。 不过,正因为在金融领域的深入研究,包括资源配置和历史经验的积累,蚂蚁也形成了自身独特的场景优势。首先,我们拥有涵盖整个生命周期的全方位团队,尤其在双十一等大型促销活动时展现出的高可用性经验,助力于推进全生命周期的代码大模型,这是我们与外部的主要区别之一。其次,我们在特定领域,尤其是金融和前端领域,积累了一定的经验,特别是在对安全性要求极高的支付系统中,这些经验使我们在安全性、可靠性和可信度方面具有独特的竞争优势。尽管面临诸多挑战,道路漫长,但我相信,蚂蚁将与开源社区共同努力,在万物摩尔定律的引领下,未来两三年内能够在一定程度上解决这些问题。还有一件事 最后,面对当前大型模型的迅速发展,李建国博士不禁感慨:我曾在深度学习领域工作,那时竞争非常激烈,尤其在 2019 年前,我发现这个领域的发展已经达到瓶颈,转而进入 NLP 领域,却发现这里同样竞争激烈。但不可否认的是,大型模型再次点燃了 NLP、视觉处理和代码生成等多个领域的热情,使其焕发出新的生机。对于未来的发展,李建国尤为看好 具身智能 的前景,这将是未来五到十年内的研究热点。它将架起数字世界与物理世界之间的桥梁,具备感知和执行操作的能力。这可能带来类似于《黑客帝国》中的场景的巨大进步,甚至可能像《终结者》电影中所展示的那样,成为真正的飞跃。

来源:百家号
原文标题:蚂蚁李建国:当前 AI 写代码相当于 L2.5,实现 L3 后替代 50% 人类编程
声明:
文章来自网络收集后经过 ai 改写发布,如不小心侵犯了您的权益,请联系本站删除,给您带来困扰,深表歉意!
正文完
 0
小智
版权声明:本站原创文章,由 小智 于2026-02-21发表,共计4332字。
转载说明:除特殊说明外本站文章皆由CC-4.0协议发布,转载请注明出处。
使用智语AI写作智能工具,您将体验到ChatGPT中文版的强大功能。无论是撰写专业文章,还是创作引人入胜的故事,AI助手都能为您提供丰富的素材和创意,激发您的写作灵感。您只需输入几个关键词或主题,AI便会迅速为您生成相关内容,让您在短时间内完成写作任务。
利用AI智能写作工具,轻松生成高质量内容。无论是文章、博客还是创意写作,我们的免费 AI 助手都能帮助你提升写作效率,激发灵感。来智语AI体验 ChatGPT中文版,开启你的智能写作之旅!
评论(17 条评论)
云朵鹿 评论达人 LV.1
2026-02-20 19:41:14 回复

AI全栈工程师需求迫切,未来的招聘市场会不会变得更有趣?

     未知
沐晚风 评论达人 LV.1
2026-02-20 19:31:14 回复

AI编程工具的学习曲线会不会很陡?新手入门会不会变得更加困难?

     未知
夏遥白 评论达人 LV.1
2026-02-20 19:21:14 回复

未来的AI全栈工程师将成热门职业,那传统程序员的转型之路如何规划呢?

     未知
青柠鹿 评论达人 LV.1
2026-02-20 19:11:14 回复

AI的推理能力和安全性是未来发展的关键,企业应密切关注这两个方面。

     未知
微光鹿 评论达人 LV.1
2026-02-20 19:01:14 回复

人工智能在编程领域的进步真令人兴奋,尤其是CodeFuse的应用。据说它的代码生成效果很不错,有没有人分享一下使用体验?

     未知
林橙沫 评论达人 LV.1
2026-02-20 18:51:14 回复

在AI编程工具快速发展的背景下,传统开发者是否应该加强学习和适应能力?

     未知
於若蓝 评论达人 LV.1
2026-02-20 18:41:14 回复

想象一下,未来的程序员不再是单纯的代码工人,而是项目的设计师和管理者,这样的转变很有趣。

     未知
夏岑风 评论达人 LV.1
2026-02-20 18:31:14 回复

开发者应关注AI工具的学习成本,可能会影响到新手入行的难度。

     未知
糖之森 评论达人 LV.1
2026-02-20 18:21:14 回复

对于AI编程工具的普及,我觉得企业应提前考虑员工培训,以适应未来的变化。

     未知
沈林风 评论达人 LV.1
2026-02-20 18:11:14 回复

希望未来的AI工具能在安全性上有所突破,毕竟数据安全至关重要。

     未知
许春青 评论达人 LV.1
2026-02-20 18:01:14 回复

未来的程序员可能需要掌握AI的使用,是否该开始考虑相关的培训?

     未知
拾晚风 评论达人 LV.1
2026-02-20 17:51:14 回复

AI编程能自动化很多环节,可是安全性问题依然存在,谁来负责这些风险呢?

     未知
南光喵 评论达人 LV.1
2026-02-20 17:41:14 回复

70%的代码问题靠大模型解决不了,这让我有点担心。

     未知
顾风然 评论达人 LV.1
2026-02-20 17:31:14 回复

看了这篇文章,觉得AI编程的应用场景越来越多,真是个巨大的机遇。

     未知
团北屿 评论达人 LV.1
2026-02-20 17:21:14 回复

李建国的观点很有启发性,AI编程真能改变行业格局吗?

     未知
玖橙子 评论达人 LV.1
2026-02-20 17:11:14 回复

建议关注AI编程工具的安全性和可靠性,毕竟在实际应用中,这关系到企业的核心数据。

     未知
顾沐眠 评论达人 LV.1
2026-02-20 17:01:14 回复

听说CodeFuse的下载量接近170万,看来大家对AI编程工具的需求很高啊。

     未知
利用智语AI写作工具,轻松生成高质量内容。无论是文章、博客还是创意写作,我们的免费 AI 助手都能帮助你提升写作效ai率,激发灵感。来智语AI体验ChatGPT中文版,开启你的智能ai写作之旅!
17