共计 4780 个字符,预计需要花费 12 分钟才能阅读完成。
作者:杜伟
想象一下,人工智能早已不再局限于程序员的角色,而是开始向架构师这一更高层次的职业发起挑战。
随着人工智能在研发领域的不断进步,它能够为工程师提供的支持也日益丰富。从最初的编码加速器,逐渐扩展到架构理解、质量分析、安全扫描和测试生成等多个领域。同时,结合 RAG 技术的实际应用,AI 代码助手在对私有知识和本地环境的理解上正不断突破自身的能力边界。
在年初,英伟达的创始人兼首席执行官黄仁勋提出的观点,引发了计算机行业的广泛讨论。他指出:“生成式人工智能的不断发展显著降低了学习编程的必要性,未来每个人都有可能成为程序员。”同样,百度创始人兼首席执行官李彦宏也在一场访谈中提到,“这轮人工智能的变革可能会更为彻底,未来程序员这一职业可能将不复存在,任何会说话的人都能具备编程的能力。”
这两位科技领袖的看法并不意味着未来程序员会失业,而是表明在人工智能的助力下,越来越多非程序员的研发角色也能掌握基本的开发技能,而专业的软件工程师在 AI 的辅助下将能发挥更大的价值。
此外,这两位科技巨头的观点也揭示了一个显著的趋势:随着大型模型驱动的 AI 代码助手在商业场景中的应用,AI 在研发流程中所占的比例愈发重要。根据 Stack Overflow 2024 的开发者调查报告,76% 的受访者表示他们正在或计划在开发过程中使用 AI 工具,而对其持有好感的比例高达 72%。
无论是国内还是国际的大型企业,纷纷在 AI 代码助手这个领域进行重磅投资,早期进入市场的企业已经开始在自身业务中取得显著成效。例如 百度的智能代码助手「文心快码 Baidu Comate」已经实现了其内部代码生成的 30%。。
提到文心快码(Baidu Comate),它在 6 月底的百度 WAVE SUMMIT 深度学习开发者大会上正式获得了中文名称,并且更新至 2.5 版本。自 2023 年 4 月推出以来,文心快码已经成为一位“练习了近一年半”的 AI 程序员。
文心快码:从程序员到架构师的蜕变
经过一段时间的运作,文心快码已经能够支持超过 100 种编程语言,包括 C /C++ 和 Java,同时兼容 19 款主流 IDE 平台,如 VS Code 和 Jetbrains。这款工具不仅可以续写现有代码,还能够根据自然语言指令生成代码,甚至在已有代码的基础上撰写注释。根据我们的观察,目前百度内部约有 80% 的工程师在积极使用文心快码。
随着基础模型能力的不断提升,加上 AI 代码助手在实际工作中的应用日益熟练,文心快码的自我能力也随之进化。令人惊讶的是,它不再满足于仅仅充当程序员的角色,逐渐展现出能够胜任架构师职位的潜力,这一转变引发了我们对其能力的重新审视。
然而,要深入了解文心快码的“进阶能力”,我们首先需要厘清程序员和架构师之间的区别。
AI 程序员的职业进阶
通才与专才的辩证关系
如果程序员是某一特定技术领域的专家,比如前端、后端或移动应用开发,那么架构师则是多个技术领域的全才。他们不仅需要在软件开发、系统架构、网络通信和数据库设计等方面具备广泛的知识,还能够将这些知识灵活运用于实际工作中。
从职责上看,程序员主要专注于实现层面的任务,如编写代码、调试和测试以及代码维护等,而架构师则负责系统的整体设计和规划,包括架构设计、模块划分和技术选型等,还需做出关键的技术决策并指导团队的工作。
因此,程序员想要晋升为架构师,就必须在多方面进行提升。同样地,如果 AI 代码助手希望顺利转型为架构师角色,必定需要在责任和技能层面都有显著的进步。
文心快码:迈向 AI 架构师的新纪元
文心快码已成功自称为「互联网首位 AI 架构师」,这表明其具备了相应角色所需的重要技能与能力。
自从在百度内部投入使用以来,文心快码在处理常见编程任务方面表现卓越,代码采纳率已达到 46%。如今,随着其向架构师角色的转型,文心快码不仅仅是简单的编程工具,更加深入理解业务架构、测试过程以及领域知识,从而有效解决编程中的复杂问题。
首先,文心快码显著提升了解决架构问题的效率,这些问题通常涵盖系统的层次结构、模块划分以及控制流和数据流等方面。即便人类架构师在这一领域的统筹也很具挑战性,而文心快码凭借其架构师能力,能够通过 代码解释 迅速掌握函数在实际业务背景中的含义。
此外,为了更清晰地呈现编程逻辑和项目管理的全流程,文心快码还可以利用 流程图 的方式,直观地展示完整的调用逻辑,帮助用户更好地理解和分析。

其次,代码质量是架构师必须关注的重点领域,而单元测试(UT)则是确保代码质量的关键手段,以维护系统的稳定性和可靠性。文心快码在 单元测试生成 方面实现了全面的增强,不仅 UT 生成效果显著提升,所生成的 UT 用例更是达到了 100% 的有效性。
这一切得益于文心快码自动识别工程所使用的测试框架版本,它能够自动识别被测方法的跨文件依赖,并参考已有单元测试的书写风格,从而生成更贴近实际应用场景的单元测试代码,效果更佳、可用性更强。
同时,得益于文心快码四层架构的 AI 优化,UT 生成的速度也得到了极大的提升。面对复杂的函数时,平均仅需 6 秒便能自动生成可用的单元测试,大大缩短了加载和等待的时间。
除了在单元测试生成的效果和速度上实现了显著提升之外,文心快码还具备批量生成单元测试的能力,从而在质量、速度和数量方面实现了全面的提升。
面对日益复杂的变更函数以及累积的历史代码,文心快码能够一键处理多种类型的文件,包括目录和单个文件。它不仅能高效生成代码,还能在验证和修复的过程中同步进行,从而确保单元测试用例的有效性与可靠性。

此外,文心快码在识别和修复程序中的错误方面表现得更为出色。用户只需选定出错的日志,文心快码便会进行对比分析并提出修复建议,错误原因一目了然。同时,借助简洁的指令,用户可以进行多轮调试,轻松解决在研发过程中遇到的各种复杂问题。

根据百度对架构师的定义,文心快码如今在业务理解、代码能力、文档编写和技术视野等多个方面都有了显著增强,同时也提供了一系列相关的自动化服务。
当像文心快码这样的人工智能代码助手从架构师的角度分析和解决问题时,无疑会为整个开发流程,包括需求提出、代码编写、测试与发布、潜在 bug 及安全漏洞检测等环节,带来更大的提升,加快业务迭代的速度。
当然,想要做好一项工作,必需先掌握合适的工具。文心快码能够发展到具备架构师能力的程度,并非一朝一夕,而是多种因素共同作用的结果。
进化的背后
是多点发力
文心快码的全新进化:强大模型与独特优势的结合
众所周知,文心快码是以文心大模型为基础动力,最近刚刚升级至 4.0 Turbo 版本。通过更为庞大的训练数据、优质的数据分布与先进的训练算法,文心大模型在理解和逻辑推理能力上再一次实现了飞跃。
可以说,文心大模型的强大为文心快码的转型提供了坚实的理论支持和基础。
除此之外,文心快码在高质量训练数据集、专家参与构建的知识体系、私域知识的增强,以及精细调优和优化方面,都展现出了独特的优势。
首先,文心快码在数据层面进行深入探索。作为人工智能的三大关键要素之一,数据对模型训练的效果至关重要。文心快码拥有丰富且高质量的训练数据集,这些数据不仅包括百度内部筛选出的优秀代码,还涵盖了 GitHub、GitLab 等主流开源代码库,确保了预训练数据的多样性和丰富性。
因此,依靠更全面、更高品质的数据支持,文心快码能够更深入地理解和学习多种编程语言、框架以及在真实业务场景下的编码规律。
其次,在构建知识体系的过程中,文心快码采取了双管齐下的策略。不断吸收和学习新知识是提升人工智能理解、推理和决策能力的关键,也是提升实际应用中精准度与效率的重要因素。
一方面,通过专家团队的协作,涵盖了语言、框架、知识集等多个维度,文心快码整理并构建了包含上万个知识集的专家知识体系。这一体系不仅覆盖基础语法、数据结构等通用知识,还深入到特定框架、库以及业务场景的高级应用,实现了通用知识与专用知识的有效结合。
另一方面,文心快码还增强了私域知识的积累。在关注外部客户的业务需求时,文心快码为其提供了基于 RAG 技术的数据检索增强功能,这有效提升了在特定业务场景中的生成能力与准确性。同时,完善的评估与持续优化机制确保了上线后能够及时响应客户反馈,快速调整以适应他们不断变化的业务需求,形成了数据、效果、产品功能和应用实践之间的快速反馈迭代链条。
聚焦精细调整与持续优化的技术革命
最后,我们不得不强调的是 对精细调优和优化的重视。在百度内部,这一做法显得尤为突出。通过对成千上万名工程师的研发实践及内部用户的使用习惯和需求进行深入分析,利用类似 DPO(数据驱动优化)的技术手段,构建了一个专门反映用户真实需求的数据集。同时,这一过程中的不断迭代和优化有效地形成了数据飞轮效应,为模型的精细调整提供了持续的指导。
由此可见,除了底层模型的支持外,文心快码作为 AI 架构师,已经在数据、知识、精细调整和优化等多个技术层面做好了充分的准备。
如今,文心快码已经赢得了众多行业客户的认可,并在喜马拉雅、数蓬科技、南威软件、华农保险等公司的应用中显著提升了研发效率,为它们的业务发展和技术创新注入了新的活力。
总结
从微软推出 Copilot 编程助手,到各种代码大模型和智能代码助手如雨后春笋般出现,再到今年 AI 软件工程师 Devin 的问世,AI 的发展速度确实令人惊叹。
我们不仅要看到 AI 代码助手所蕴含的应用潜力。根据《Gartner 2024 年十大战略技术趋势》的预测,到 2028 年,75% 的企业软件工程师将会使用 AI 编码助手,而这一比例在 2023 年初尚不足 10%。显然,随着需求的增长,AI 代码助手的不断“修炼内功”是必然趋势。
此次百度文心快码职能向架构师的扩展,正是这一趋势的重要体现,标志着其在编程领域的影响力日益深入,逐步从单一的编程任务扩展到整个研发全生命周期,甚至可能重塑研发模式。
可以预见,在未来相当长的一段时间里,AI 代码助手将持续存在并不断演进。对编程及更高层次的架构设计工作来说,其助力将愈发显著。届时,工程师们将不再被繁杂的工作束缚,效率将大幅提升,从而能有更多时间享受生活。
近期在热搜中引起关注的太原理工 2024 年软件工程专业招生近 2000 人,这从侧面反映出软件工程师这一职业的广阔前景。而且,该专业所属的软件学院也是首批使用文心快码的机构之一,表明新技术与未来的软件研发力量之间已建立了紧密的联系。
AI 时代的合作与共存:未来的职场展望
因此,如何在理念和实践中充分利用人工智能,成为了一个重要课题。正如斯坦福大学的著名学者 Erik Brynjolfsson 所指出的,企业应当把 AI 视为员工的合作伙伴,而不是竞争者。程序员应当把那些重复、繁琐和机械的任务交给 AI,而自身则应该专注于那些能够体现创造性和核心价值的工作。
以百度为例,该公司在开发文心快码的过程中,汇聚了成千上万工程师的实践经验,形成了三大「人机协同价值观」。其中包括:AI 不会替代人类,但掌握 AI 技能的人在职业市场中将更具竞争力;在人机协作中,人类始终处于控制地位;人机之间的协同与共同进化,为和谐共处提供了借鉴。
展望未来,随着 AI 代码助手的功能日益强大,其能够胜任的任务也将不断增加,人类与 AI 的共存将成为一个长期的课题。各方,包括百度在内,需汇聚智慧,妥善应对和解决这一挑战。
欲体验文心快码,获取属于你的专属 AI 架构师,请点击文末链接:
https://comate.baidu.com/zh?inviteCode=jqzx

