共计 3645 个字符,预计需要花费 10 分钟才能阅读完成。
腾讯云近期推出了重磅创新的CodeBuddy软件开发智能体Craft(2025年4月升级版),基于双核驱动架构(混元大模型与DeepSeek V3)以及MCP协议生态,重新定义了对话式编程的标准。Craft能够支持从需求分析到多文件代码生成、重构及测试等全过程的自主开发,实现在复杂工程环境中无干预的代码生成。此外,Craft作为国内首个兼容MCP协议的代码助手,能够无缝对接腾讯云的生态服务,提供跨平台的任务调度,为开发者带来“全自动人机协作”的沉浸式开发体验。
编码智能体的概念
接下来,我们来探讨一下编码智能体的含义:
编码智能体能够根据自然语言需求理解项目代码,自动定位并修改目标代码,也可以创建全新的代码项目。当用户明确具体需求并了解变更范围时,编码智能体能够快速感知上下文,帮助用户精准实现需求代码。
在行业中,像GitHub Copilot Agent、Cursor Agent(以前称为Composer)和Devin等,都是编码智能体的成功应用示例。Cursor通过Agent模式重新定义了无干预的代码生成,而Devin则标志着腾讯云Code Buddy推出的Craft智能体以「对话式编程」和「多文件工程化协作」为特色,推动技术竞赛进入新阶段。这一对抗不仅仅是功能上的较量,更是AI编程工具从「辅助工具」向「研发伙伴」的转变。
一、开发工具的范式变革:从单一编码到自主编码流程的提升
2025年春季,AI编程工具市场迎来了重要的转折。在Cursor和GitHub Copilot的Agent模式下,实现了全流程的自主生成、运行和修正,经过多轮反思,最终满足工程项目的需求和解决问题。
4月份,腾讯云Code Buddy推出了Craft智能体,标志着在「多文件自主AI协同编码生成」方面的突破。下方图示展示了一个包含六个步骤的软件开发流程:首先在Edit Chat中提出需求并添加文件,接着进行需求理解与规划,然后进行文件操作(读取/新增/修改),之后是IDE实时编码渲染,接着整理变更清单,最后接受或回退变更。

二、功能比较:工程化的深度决定工具的极限
(1) 生成维度的区别
Cursor Agent的优势在于能够在本地IDE中控制内核IDE的编码过程,并能在适当的时机提供精准的代码生成、内联对话,以及调动内置编码智能体的AI能力来完成编码任务。
Craft则通过主流IDE实施「需求-拆解-执行-验证」的四阶段工作流程,能够高效完成如「为电商系统增加风控模块」等复杂的系统工程任务,涉及20多个文件。用户输入自然语言需求后,Craft会自动规划技术方案、检索代码库、生成模块间接口,并以差异视图展示更改。这种「项目级AI架构师」的能力,使其在React组件重构和微服务链路改造等场景中展现出显著优势。
(2) 生态整合能力
Craft在MCP市场中处于领先地位,开发者可以直接利用主流的MCP服务。例如,在开发AI Agent时,开发者无需搭建服务器,只需通过MCP协议即可便捷地完成主流工具的本地安装与运行。在这种互动模式下,无论是构建小程序还是企业级项目,均可实现端到端的解决方案能力。
(3) 人机协作模式的Plan模式的创新
Craft的对话界面支持历史记录的回溯和版本管理,成功解决了AI生成代码可能导致的混乱问题。开发者可以逐行选择接受或拒绝代码的修改,若功能出现偏差,也能通过实时的技术对话进行纠正。此外,Craft推出的Plan模式能有效应对需求描述不明确的问题,帮助开发者澄清需求,相较于Cursor的Agent直接生成方式,它更容易实现修改目标。
三、 实战检验:五子棋案例中的工具效能
需求拆解到任务完成
提问内容: 创建一个微信小程序,实现五子棋游戏。此游戏必须遵循完整的五子棋规则,包括黑白双方轮流下子、判断胜负的连线以及禁手规则等。此外,需要清晰展示玩家的失败条件,例如无合法落子位置或超时未下子等情况。请确保代码结构清晰,界面友好,用户体验流畅。
考察目标:生成的五子棋小程序应能在微信IDE中成功打开并编译运行。
1. Cursor的表现
调用了三个工具:
1. 读取目录,判断项目是否为空
2. 创建目录,为小程序建立工程
3. 生成必要文件
最终生成了8个文件。

启动微信小程序,观察运行结果。

初次尝试时没有成功落子,点击操作未能得到响应,且出现了错误提示。随后,我将错误信息提交给Cursor,试图让其自动修复,以便能够顺利运行。


虽然能够落子,但棋子的位置并不准确,游戏的胜负逻辑也存在问题。然而,至少没有出现错误提示。我决定继续优化这部分功能。
五子棋游戏体验的优化与调整
在进行五子棋游戏时,我遇到了一个问题:棋子无法准确落下。为了改善这一体验,需要对棋盘的落子事件进行优化,以确保黑白子能够正确地完成游戏。
最终,还是无法顺利模拟出完整的五子棋游戏过程,这让我感到非常沮丧。
2. 腾讯云Craft的表现
首先,我选择了Plan模式,并提出了相同的问题。在这种模式下,它会询问很多澄清问题,就像产品经理与开发者之间的需求讨论,帮助拆解任务。对于不明确的地方,它会主动提问,而我只需给予相应的答案。

在澄清需求后,Code Buddy还提供了mermaid代码,我通过mermaid online查看,发现描述得相当清晰。

接着,系统还附上了每项操作的具体实现方案。只需点击「开始」按钮,便可进入代码生成的阶段。

最终,系统生成了总计十个文件,进一步帮助了我的开发过程。
四、 实战检验:用户操作的流畅度与体验

运行效果让我感到满意。打开微信IDE并导入项目,直接运行后成功,并且落子位置准确无误。
五子棋.mov

Craft
整体设计相对简洁,仅包含对话框以及文件添加功能,结果的展示也十分直观。

Cursor:
在Cursor方面,上述内容也得到了充分的考虑。
优化与反馈:提升五子棋项目的用户体验

引用的上下文非常详尽

能够将终端反馈问题直接嵌入到聊天编辑框中

支持重新生成、展示和收缩代码功能

综合来看,各种插件在不同方面展现出各自的特点。Cursor作为一款原生的IDE,在交互生成的体验上,能够超越许多插件,效果也相对优异。对于倾向于使用本地IDE的用户而言,Cursor无疑是一个不错的选择。然而,20美元的定价以及数据可能外泄的问题,确实会让一些开发者感到犹豫。另一方面,腾讯推出的Craft在应用生成的质量与效果上,表现出色,成为一个值得关注的替代品。虽然在插件方面Craft尚未能超越市场主流,但它的生成体验依然不错,且在细节处理上还有很大的提升空间。团队的持续更新频率也非常可观,几乎每天都有新版本推出。Craft的Plan模式提供了一个有效的差异化优势,尽管在模型能力上还无法完全匹敌最强的Claude模型,但通过清晰的需求扩展,能够为后续任务的执行提供更为精准的信息和指导,确实是一个很具前瞻性的设计。
|
维度 |
CodeBuddy |
Cursor |
|
简单任务处理 |
能够满足用户的一般需求 引入Plan模式,有助于对用户需求进行多轮澄清和深入分析 ⭐️⭐️⭐️⭐️ |
在任务完成的基础上,中文输出的效果也相当出色 ⭐️⭐️⭐️⭐️ |
|
复杂任务处理 |
能够实现整体需求,过程中可能会出现错误,用户可依此进行调整 ⭐️⭐️⭐️⭐️ |
能够满足整体需求,且完成度与效果更佳,视觉呈现更为突出 ⭐️⭐️⭐️⭐️ |
|
响应时间与处理速率 |
响应速度最快(38秒),相比Cursor稍快,或与国内网络环境有关 ⭐️⭐️⭐️⭐️⭐️ 性能评估与用户反馈响应时间表现出色,最快为49.5秒,令人印象深刻。⭐️⭐️⭐️⭐️ 在终端执行方面,用户可以直接在侧边栏进行操作,如跳过或终止等,功能非常齐全。⭐️⭐️⭐️⭐️⭐️ 系统支持多种模型的切换,能够接入Default和DeepSeek-V3等本地模型API。⭐️⭐️⭐️ 同时,系统还提供十几种主流模型,并具备自动化切换的能力,十分便捷。⭐️⭐️⭐️⭐️⭐️ 在用户体验方面,交互设计有待进一步优化,以提升整体使用感受。⭐️⭐️⭐️⭐️ 相比之下,Cursor的使用体验和多模型效果显得更为优越。⭐️⭐️⭐️⭐️⭐️ 在成本方面,个人和企业版本皆为免费提供,极具吸引力。⭐️⭐️⭐️⭐️⭐️ 然而,某些版本的定价可高达20美元,显得相对昂贵。 探索Cursor的卓越体验与成本优势 在整体使用体验上,Cursor无疑展现了其出色的一面。与其他工具相比,它在多模型的效果上也显得更加优越。对于用户而言,无论是个人还是企业版本,均可免费使用,这无疑是一个令人心动的选择。然而,值得注意的是,某些特定版本的价格最高可达20美元,这在一定程度上让人觉得比较昂贵。 |
