共计 6707 个字符,预计需要花费 17 分钟才能阅读完成。
字节跳动推出了 AI 编程助手 Trae 的 2.0 版本,并开始逐步向用户开放权限。此次更新引入了 SOLO 模式 —— 一个具备上下文处理能力的系统,能够根据完整的信息进行任务规划与执行,涵盖从代码编写到功能交付的整个开发流程。
SOLO 是一个 Context Engineer,能够独立生成软件,替代人类处理开发流程中那些琐碎、重复且高度流程化的环节。
SOLO 模式被视为“AI 辅助”向“AI 主导”转变的关键一步。与传统的需要手动驱动的智能工具或代码补全软件相比,SOLO 能够在理解需求的基础上,主动协调工具以完成复杂的开发任务。当前,该系统已经支持 Web 应用的全流程交付,未来也将拓展到更多应用场景。
我们注意到,许多开发者已经获得了内测资格,大家对 SOLO 模式的实际体验如何呢?
感谢邀请,涉及个人利益:Trae 的核心开发者。转眼间,我在这个领域已经摸索了半年,今天想畅所欲言,聊聊《重生之我在大厂搞 AI Coding》
简而言之,内容丰富~
重生之我在大厂搞 AI Coding
时间线其实比较简单:
- 2022 年 11 月 15 日,突如其来的蚂蚁大礼包让我重新审视未来的规划,幸运的是我很快加入了字节。
- 2023 年 11 月 15 日,我接到一个电话,被召至杭州闭关室,从此负责 MarsCode Cloud IDE 团队的云工作区等相关事务,那一年充满了疯狂的奔跑。
- 2024 年 11 月 15 日,我再次进入闭关室,又是疯狂的半年,因此孕育出了大家看到的 Trae 1.0 和 2.0 的演进。
我常常和朋友开玩笑说,11 月 15 日是我的受难日,重生之我在大厂搞 AI Coding。今年的 11 月 15 日又会发生什么呢?我不知道,但我对此充满期待。
不知不觉半年过去了,定坤在上个月的火山引擎 Force 大会的主题演讲《聊聊 AI Coding》中提到 Trae 的月活跃用户数已突破百万,我们也算是交出了一份阶段性的答卷。


从 MarsCode 到 Trae
了解我们的同学应该知道,2024 年我们发布了很多与 Cloud IDE 相关的产品,包括 MarsCode Cloud IDE、Coze IDE、掘金 AI 刷题等,字节内部的 Cloud IDE 用户覆盖率也是相当可观。
首先,我想澄清一个概念,Cloud IDE 不等同于 Web IDE。从我的角度来看,IDE 分为前端交互层和业务逻辑层:
- 前端交互层可以在浏览器或本地 Electron 中运行,可以是完整版本也可以是轻量版。
- 业务逻辑层可以在用户本地、远端 K8S 容器或浏览器的 WebContainer 中运行。
Cloud 的意义在于 Code Anywhere,上述的交互层与逻辑层可以自由组合,既可以在同一台机器上,也可以通过 SSH Remote 分离连接,甚至可以使用 iPad 进行操作。这就是我对 Cloud IDE 的理解。
Cloud IDE 的远程容器被称为云工作区,技术挑战颇为艰巨:
- 常见的微服务通常是非实时的且无状态的,能够负载均衡,在容量不足时可以逐步扩容;
- FaaS 服务则是实时调度的,但无状态,因此可进行预热等;
- Cloud IDE 是 实时调度 + 有状态,每个项目对应一个容器,依赖于磁盘数据,对启动速度极为敏感,用户在打开时必须等待初始化和加载,因其涉及磁盘代码数据,所以是有状态的,无法负载均衡,也很难进行预热。
在 2024 年,我们在这方面投入了大量精力进行优化,不仅对 VSCode 进行了显著的 Rust 化,还深入定制了 K8S 层面,最终在性能、成本和稳定性等方面取得了优异成果,我们的端到端启动性能 P90 达到了 5 秒,而 GitHub Codespace 需要 30 秒,Google IDX 甚至需要 1 分钟,可以说在这一指标上达到了世界级水平。
MarsCode 启动速度 https://www.zhihu.com/video/1930983846276466605

当然,技术的成功并不意味着业务的成功,很多时候需要在恰当的时机选择合适的路径。对于 Cloud IDE 场景来说,尽管在字节的覆盖率很高,但 MarsCode 作为一个面向消费者的产品,天然受到用户场景的制约,因为国内企业的代码很难上云,而程序员的个人项目又不足以支撑产品的可持续发展。
因此,在 2024 年 11 月 15 日,我们选择回到半山坡,决定从 Native IDE 这条道路重新攀登 AI Coding 的高峰。当然,我依然相信 Cloud IDE 的价值,它将以云端一体的方式与我们重聚,殊途同归,一都不能少。果不其然,在 2025 年中,业界开始关注 Remote Agent 场景,而在这方面我们已有丰富的积累,随时待发。

我对 AI Coding 的理解
之前在播客中也讨论过:《探秘 AI IDE,对话字节 Trae & 迪魔王 Devmore》
LLM 大模型的核心在于预测下一个字符,相较于复杂的自然语言,编程语言更加简洁、严谨且可预测,因此 AI Coding 领域成为这一波浪潮中的首个 PMF 产品。在这一领域的实践日新月异,几乎每个月都在刷新我们的认知。

标题:AI 编程的演变:从辅助到自主的未来之路
“`html
在我看来,AI 编程的发展与自动驾驶有一定相似之处,整体可以划分为几个阶段:AI 辅助编程 → AI 结对编程 → AI 自主编程。目前我们推出的 Trae Builder、Cursor Composer 和 Windsurf Cascade 等工具,都着眼于 AI 结对编程这一阶段。

AI 辅助编程
代码补全
在早期的编程过程中,我们依赖代码提示,通常通过“下拉列表”来选择方法和属性。
然而,随着 ChatGPT 的问世,我们逐渐认识到 LLM 模型的核心在于预测下一个字符。与复杂的自然语言相比,编程语言显得更加简洁、严谨和可预测。因此,Copilot 的出现,给代码补全带来了巨大的创新,其令人惊叹的 Ghost Text 交互方式让程序员只需轻触 Tab 键便可迅速采纳建议,极大地激发了开发者的创造力。

不过,这种方式仅适用于新增代码的补全,因此 Codeium 和 Cursor 在 Super Completion(又称 Tab Tab)方面进行了进一步的创新。举个简单的例子:如果一个前端的地区下拉列表起初是英文,后来改为中文,当你在第一行中间修改字段后,再次按下 Tab 键,便可以一键更新下面所有字段。我们最近也发布了 Trae Cue 超级代码补全功能。
从“代码提示”到“代码补全”,再到“超级补全”,这标志着 AI 编程能力的跃迁。

代码生成
接下来谈谈“代码生成”。当 ChatGPT 刚发布时,程序员们被对话式生成算法震撼,但这种方法需要在 Chatbot 中手动对话,再将生成的内容复制回 IDE,过程繁琐。
那么,我们能否直接在 IDE 中与 AI 进行对话呢?因此,IDE 中开始出现 SideChat,许多插件如 Copilot Chat 和 Codeium 的出现使得这一想法变为现实。它们的优势在于能够直接获取 IDE 和代码仓库的上下文,无需手动复制粘贴。

尽管这种技术看似复杂,其实原理非常简单。例如,当你请求 AI“帮我实现这个 HTTP 请求函数”时,实际上 AI 在拼接一段信息:“用户正在打开 xx 文件,光标位于 xx 行,该行的函数名和注释为 xxx,最近访问的文件有 a、b、c,项目目录结构为 xxx,现在用户希望在当前位置实现 HTTP 请求逻辑。”然后将此信息传递给 LLM 生成代码,最后再进行合并。其实与手动与 ChatGPT 对话并无太大区别,只是 IDE 帮助你整理了合适的上下文。
这里的技术关键在于:项目理解能力、上下文裁剪、模型能力及工程上的 PE 能力。Cursor 在这一领域表现出色,成功脱颖而出。Claude Sonnet 3.5 的出现也功不可没,它标志着模型能力的一个里程碑,并在去年引发了一波热潮。
在这个阶段,开发者可以直接在 IDE 中与 AI 共享相同的上下文,避免繁琐的转述,而接下来需要解决的问题则是如何将生成的代码无缝合并到相应的文件中,这就是 Fast Apply 代码合并 的场景。
简单来说,就是如何让 AI 生成合适的代码并自动合并到正确的位置。实现方式有多种,比如全文重写、搜索替换代码片段、Diff 合并等,业界也有多种实践结合使用。Cursor 自己训练了一个 Fast Apply 小模型,而我们 Trae 则支持多种方式。

以上两个能力体现了我所定义的 AI 辅助编程阶段。
AI 结对编程
AI Agent 的定义
随着 AI 能力的不断增强,用户的需求也愈加复杂。我们希望 AI 能展现更多的自主性,仿佛一个有潜力的实习生与我们并肩进行编程,这种角色被称为 AI Agent。
那么,一个典型的 Agent 是如何运作的呢?Manus 最近在文章中提到:
『在获取用户输入后,Agent 利用一系列工具来完成任务。在每次迭代中,模型依据当前上下文,从预定义的动作空间中选择一个动作。该动作在环境中执行后产生观察结果,动作和观察结果会被添加到上下文中,形成下一次迭代的输入,这一循环会持续到任务完成。』
简单来说,Agent 的核心在于:AI 具备了 思考能力 、 调度能力 ,以及 上下文环境感知能力 和工具调用能力。它能够感知自身所处的环境,并根据目标进行思考与任务拆解,调动各种工具来完成这些任务。

小小提示:如果在使用 Trae 时发现需要手动“应用”,请务必检查 Chat 对话框中是否缺少 @builder。下次我们将进行优化!
Trae Agent 1.0
Trae Agent 于 2024-12-17 正式立项,经过 20 天的努力,才推出了大家看到的 Trae 1.0 版本。

在 Agent 1.0 的架构中,由于当时大模型的能力尚未成熟,我们的流程主要依赖于 Workflow 流程,即思考 → 规划 → 执行 → 观察的循环。它在 Trae IDE 环境中运行,通过 IDE 的功能收集信息、构建上下文,并利用大语言模型进行思考与规划。同时,借助 IDE 提供的文件操作和命令行功能进行工具调用,满足编码相关需求。

除了 Agent 流程外,还有代码知识图谱(Code Knowledge Graph)及 Fast Apply 代码合并等功能。
顺便吐槽:有时看到一些社区成员说 AI IDE 仅是 LLM 的外衣,实在让人无奈,他们连领域认知的基本门槛都未能触及。
Trae Agent 2.0
随着大量用户反馈的涌入,我们收到了不少意见,1.0 架构在某些场景下的表现并不理想。同时,随着 LLM 大模型能力的不断提升,依赖于 Proposal + Plan 固定工作流程的方式,反而可能限制模型的发挥。
“`探索 Agent 2.0:AI 自主化的新篇章
在 2025 年 4 月 8 日,我们再次闭关,经过 21 天的努力,推出了 Agent 2.0 架构。此次升级使得大型语言模型(LLM)获得了更大的自主性,能够主动理解需求、感知周围环境,并驱动工具执行任务与获取反馈,这极大地提升了 LLM 的能力。

此外,我们还对多种工具进行了针对性优化。例如,针对文件工具,提高了代码合并的成功率,并将代码检索简化为“搜索代码库”工具,便于 AI 按需调用,同时支持语义化的多路召回。
与 AI 的斗智斗勇常常令人感到疲惫,以下是一个 PUA 的案例:
Trae Agent 3.0
Agentic 与 Workflow 并非简单的开关,而是一个连续的光谱。我们的架构旨在提供可持续的迭代能力,使得在 LLM 能力足够时能实现更高的自主性,而在 LLM 尚不熟练的领域,通过固定的流程保留专家经验,随着模型的不断进化,可以以低成本替换节点来实现逻辑。
【付费内容,投简历后可读】
【付费内容,投简历后可读,后端:https://job.toutiao.com/s/5IEbI9PKBco】
【付费内容,投简历后可读,前端:https://job.toutiao.com/s/mMPAHQSoPFA】
【付费内容,投简历后可读】
Trae SOLO 模式
随着 Trae 的不断发展,我们逐渐认识到 AI 与 IDE 之间的主导关系正在发生变化:
- 过去是程序员在 IDE 中编码,AI 负责辅助。
- 现在更像是 AI 主导编码,而 IDE、浏览器、终端等工具则成为其助力。
因此,我们探索了 SOLO 模式,旨在将『AI 辅助 IDE』的协作方式升级为『AI 主导 IDE』。在 SOLO 模式中,AI 能够使用内置编辑器、浏览器等多种工具,未来 SOLO 还将整合更多实用工具。
此次发布的 2.0 版本主要提供了:
- 一种以 AI 为核心的交互模式——SOLO。
- 内置了针对 Web APP 场景的端到端交付代理,并将推出更多代理。
目前该模式处于预览阶段,仍有很大完善空间,欢迎大家使用并提供反馈。

这是我们一些测试用户取得的效果:



⬆️ @徐飞制作的任务看板:https://traekanbanqnwk-lfne48lzn-xufeis-projects.vercel.app
目前海外版已经发布,传送门:https://www.trae.ai。由于资源有限,我们仍在定向测试中,大家可关注官方 Twitter 或飞书群的通知,我这边也没有 SOLO 代码 。
传送门:关于 TRAE SOLO 代码后续发放方式的说明
如何与 AI 实习生有效合作?
我一直认为 AI 是:人人配备的高潜力实习生。
如今,许多人对 AI 编程感到惊讶,然而也有人对此表示质疑,其实这主要在于没有找到与不同阶段实习生的相处之道,管理好自己的期望,短期内高估,长期低估。
我认为,AI 是每个人的专属高潜实习生。对于当下的 AI 实习生,应当安排适合的任务,并提供必要的指导与信息,同时随时准备为它兜底,接手任务,这与管理一个真实的实习生没有太大区别,关键在于是否用对了方法。
- 甩手掌柜——不提供充分的上下文,仅凭一句话的需求就希望 AI 完成复杂项目。
- 超出能力范围的任务——它擅长写代码,你却期望它生成不合规的内容。不同模型有不同的使用方式。
- 招聘标准过低——想利用 Claude 4 的能力,却只愿意使用 OpenAI 3.5 免费版。
- 一分钱一分货——用 20 美元的月费期待获得 2000 美元的 token 产出。
观察社区不同人士对 AI 编程的看法也十分有趣,这反映了他们如何管理新人的实习生:
- 有些人会详细拆解并提供信息,严格指挥,只要求执行。
- 有些人会适度放权,提供必要的信息,并随时准备兜底。
- 还有些人缺乏耐心,一遇问题就发脾气,随意放养,自己则忙于其他事务,只随意抛出一些琐碎的任务。
总结与邀请加入我们
当初项目启动时,团队领导对我们说:“我们有意愿、有能力、有机会、有想法、有支持,我坚信我们能打造一款世界级的产品。”我当时将这视为“愿景”。但在 2024 年底的总结中,看到 MarsCode 的技术指标,以及 2025 年中 Trae 的百万月活跃用户,我意识到我们确实在踏实地向前迈进,我真心相信这一切。
秉承“预研一代、部署一代、分享一代”的理念,我们正在落实 Trae Agent 3.0 架构,以支持多代理和远程代理的探索。
未来的道路漫长而曲折,我们仍在 AI 编程的探索中,比起行业中的许多先行者,我们还有许多值得学习的地方,但请相信我们对此工作非常认真。
专业生产力工具的颠覆性创新必将重新塑造开发者的认知与开发方式,未来的 IDE 很可能不再是以代码为中心的形态,这一变化可能在三年内实现。我们每个人都应学会如何与 AI 有效协作。
最后,我们团队精干且充满干劲,诚邀大家加入 Trae 团队,杭州、北京、上海、广州、深圳均有基地,现招募前端、后端、AI 等各类人才。


希望开发者在使用 SOLO 模式时能多分享反馈,别让我们这些旁观者无从得知真相。