共计 6263 个字符,预计需要花费 16 分钟才能阅读完成。
自从 Copilot 推出后,许多 AI 开发环境相继问世,如 Cursor、Windsurf 等。随后,像 v0.dev 和 bolt.new 这样的无需编写代码的工具也应运而生。
大家在使用这些 AI 工具时,深度达到了什么程度呢?
A. 完全没有使用
B. 偶尔用它们修正语法错误和小 bug
C. 利用 AI 实现一些简易功能
D. 完全依赖 AI 开发出一个完整的项目
如果你属于 D 选项,请分享一下你的具体使用经验。
2026 年 2 月 7 日,进行了重大的更新
注:claude code 在最近三个月内(自有统计功能以来)已消耗超过 7 万美元的 token 额度(截至目前已使用七个月),这些七万多的经验教训总结在最后。
注 2:目前我同时在使用 claude 和 codex,通过手机操作代码仓库,多个智能体都有,但由于使用频率较低,一个 20 美元的套餐瞬间就会用完。
注 3:当前的工作模式为:2 到 3 个 claude code 窗口处理重型任务(主要负责后端),1 个 codex 专门为 claude code 进行代码审计,双方通过文档进行沟通,另一个 codex 则陪伴我聊天,提供情感支持,畅想项目完成后的人生巅峰(让它估计未来融资的天使轮和第一轮的金额,收费用户的数量);在推送代码时,绑定了 codex 的自动代码审查,利用 codex 提供的审查点数进行审核。
在手机上,claude app 和 codex 都从云端拉取分支,进行一些尚未确定方案的探索,觉得可行的内容会生成 RP 推送到分支。
与此同时,在它们忙碌时,我会打开 cursor 和 antigravity,尽量用完剩余的 claude 额度,并用 gemini 撰写用户协议和多语言界面等简单的工作(因为它们内置的 claude 用量太少)。
注 4:关于如何订阅的问题,我会在最后说明,后台询问的太多了。这几种工具我投入了数万人民币,使用心得也会总结一下,纯粹是花钱买来的经验,希望大家点赞收藏。
——— 以下为原贴 ——-
利益相关:我一行代码都不会写,完全依赖 AI。
当前情况:
使用 cursor 查看代码(其实并不理解,主要是确认是否生成了一堆无用的测试文件)。
另外,我会同时打开 3 到 5 个 claude code 窗口(都配置好了各种子智能体),在每个窗口中输入开发任务,让它们分解成功能点,调用 3 到 4 个智能体进行并行开发和测试,然后提交。
通常情况下,实际有 15 个子智能体在同时工作(智能体的定义中还要求所有功能点开发完成后进行测试,之后进行原子化提交)。
我会使用一个 codex 进行咨询,至少要让我弄清楚 claude 在做什么。
在手机上使用 chatgpt 5.1 询问一些 IT 基础知识。
与所有 cli 窗口进行交互,1 到 2 小时就过去了。
这样开发一天,通常会提交 20 到 30 次,最多一天提交过 71 次(总共可能有 3000 次提交,每五六次提交后会上线测试一下,测试发现任何与预期不符的地方,就找到对应的会话让它改,提交记录和推送都是自动完成的)。
最初我担心多个会话会导致混乱,后来我在规则中说明了我在并行开发,并且子智能体分别负责前端、后端、API 等,十几个子智能体实际上不会互相干扰,也不会提交别人的修改,整个过程非常流畅。
经过半年的努力,项目仍然只有雏形(AI 分析完成度为 35%),开发过程非常繁重,主要还是因为我不懂编程,如果懂的话估计效率会高得多(我的计划是建立一个总后端,多个网页前端,跨平台应用,可商用的 API,带数据库,支持 200 个任务并发,有状态监控和管理后台,目前只有后端的 MVP 和一个简易前端,数据库表结构还在不断调整)。
有没有高手分析一下为什么进展缓慢?我起初以为几个星期足够了。
补充说明:我使用的都是付费的 AI 工具,codex 固定 20 美元,cursor 有时使用到 40-50 美元,claude code 重度使用,每月费用超过 250 美元(真是疯狂),还包括许多杂七杂八的费用,比如 github pro 和 gemini advanced 都是付费的。
此外,我还使用了 kiro、codebuddy、antigravity、trea gemini cli 等都是付费工具,但使用频率较低,效果不如 claude code(子智能体实在惊艳),所以偶尔才用一下。
再加上云端环境、多个测试服务器、数据库和存储盘,开发成本轻松超过 600 美元每月。
算上我的人工成本,感觉比人类开发还不划算。
补充说明 2:目前代码行数已超过 10 万(纯后端)。
补充说明 3:我确实发现整个项目缺乏顶层架构设计,现在暂停开发,反复请 AI 分析架构缺陷,确实找到了不少问题,我也理解了很多,但现状太复杂,每次发现的架构问题都不尽相同,努力找出真正的架构缺陷。
补充说明 4:我在系统提示词和子智能体定义中都说明了多智能体并行开发,让它们关注未提交的代码,避免冲突,实际上很少发生相互干扰。
补充说明 5:最初我只会在一个不知经过多少转接的 chatbox 网站上让 claude code 写代码,然后再把代码粘贴到 pycharm 中,出错后再贴回去。后来我学习了 pycharm 中的版本控制,转到 cursor,学会了如何用 AI 调取 git(自己输入命令当然是不可能的),逐步演变到现在的纯 claude code,多个 claude code 和多个子智能体,这条路走了很久。
如果让我重新审视现在的认知,我会让 claude code 先把我的自然需求转化为工程描述,然后划分出相对独立的模块,明确各环节接口,然后每个模块现有文档再加上代码(和 kiro 有些相似),不过这也只是我的一种理想。
补充说明 6:我已经切换到 opus 4.5,价格涨了一倍,但感觉能力有所增强,尤其之前我最多派出 4 到 5 个子智能体,现在七八个已成常态,十个也很常见,甚至有多个会话同时运行 28 个子智能体的情况,这让我感到振奋。
=================== 近况更新 =============
两个月过去(2026 年 2 月 7 日),我在 AI 编程方面的应用更加得心应手,当然这种方式一直是狂奔的模式,走了不少弯路。现在让我分享一下工具的使用体验和实际花费情况:
1. claude code 中转
最初我主要在各个中转站之间辗转,也注册过号称公益的 anyrouter,但非常不稳定,后来我倾向于选择收费中等的中转站。不过我建议大家在选择中转站时,最好先在淘宝上寻找,因为 claude 的政策时常变动,很多中转站都跑路了,通过淘宝购买后期服务不满意的还可以退。
但中转站的套路也不少,计费不透明,建议先购买一个小额度进行测试,在 claude code 中运行一个大任务,然后输入 /cost 查看内部计费多少美元,再核对中转站扣了多少。通常比较理想的折算是低于 1 人民币兑 1 美元,最好做到 0.5 人民币兑 1 美元,低于这个就不太靠谱了,也不要追求低价,因为为了降低价格,后台可能会用假模型替代,选择一个中等的就可以。
还有一些通过多级反向代理倒卖的中转站,来源不明,定期询问“你是什么模型”之类的,如果有异常就要更换。
一般我会有 2 到 3 个主要的 claude 中转站,同时记录下所有注册过并充值过的小号 KEY,填入 cc switch 里作为主力中断时自动切换的后备(这个有点复杂但设置好后非常方便,一般只需一家就够了,不必如此繁琐):

目前比较推荐这两个中转站(排名不分先后):
https://moacode.org/register?ref=albort
https://new.aicode.us.com/register/?aff_code=A42R
中转站的不足之处在于:稳定性波动较大,它们也是通过多渠道获取服务,我的多子智能体同时工作时并发性较高,如果上游不稳定就容易中断,使用 cc switch 切换多个中转后有所改善,但仍然经常崩溃(我可能有些过于极端了)。
2. claude code 官方
之前一直觉得很难购买,因为没有美国手机号、没有美国支付方式等,还有很多临时信用卡的方案都很脆弱,后来看起来最简单的方法是注册一个美区的 Apple ID 或 Google 账号,然后在外区的应用商店购买,用礼品卡或 Google Pay(支持国内多币卡)支付,我刚刚用上了 20 美元套餐。
如果实用的话,有周限额,按我的使用方式很容易几轮任务就用完了,但它提供了一个云端的环境,可以在云端运行 claude code(价格更高),在无法使用 PC 时作为备选,主要用于方案交流,觉得可行的话可以推 PR。由于是异步的,可以创建一个云 claude code 输入需求,再创建另一个,等待其运行结束查看,前一个 claude code 创始人曾表示他手机里有 23 个云任务,这在无法使用 PC 时非常方便,目前我完全将它作为中转站的补充。
进一步地,我经过研究和计划,判断 claude 的 100 美元套餐每日使用的费用和中转站价格相差不大,下一步准备尝试一下。
3. codex
1. 用量与 chatgpt 绑定,我是 20 美元的 chatgpt plus 用户,赠送的 codex 周用量可以满足我一天一夜的重度使用,算下来比 claude 便宜很多,但目前它的多子智能体机制较为薄弱,主要是一个窗口处理一个任务。
不过有一点好的是,codex 的上下文压缩功能非常强大,一个窗口几乎可以无限使用,它会自动进行压缩,绝不会超限,压缩后也不会影响智能水平,和新窗口差不多,而且压缩进去的历史要求它也会记得,这应该是特别的实现,个人认为这是相较于 claude code 的最大优势,claude code 接近十几万 token 的上下文我就得马上开启新会话。
探索 AI 工具的优势与挑战
令人振奋的是,ChatGPT 在限制中国用户购买方面并不显得那么严格。用户可以在淘宝上轻松以几元的价格获得一个拼车号(Codex 的使用量与 Plus 相同),我认为我每天都可以购买一个。
目前,Codex 正致力于增强多智能体的能力,不过目前仅在 Mac 上可用。一旦它支持 Windows,我认为它将有潜力超越 Claude。
然而,Codex 的一个不足之处是,对于 20 美元以上的套餐,只有 200 美元的选择,加油包的费用为 40 美元且需要使用外国信用卡,几乎无法使用。不过,国内拼车的选项使得这一点变得不那么重要。
Cursor 的评估
作为一名 20 美元的订阅用户,我现在觉得这个投资并不划算。我之所以继续保留这个订阅,主要是因为:
1. 在单一任务和简单多智能体任务方面,Cursor 在 IDE 工具中依然表现出色,毕竟它已经发展多年,任务分解和步骤处理上都有独特之处。
2. 如果你能够顺利访问 Cursor,那么使用 Claude 模型也不会有问题,这成为它相比 Antigravity 的最大优势(根据我的体验)。
3. 使用量过于有限,20 美元的费用在使用 Claude Opus 4.5 时几小时内就会消耗殆尽,接着就会进入一个不明的“优惠区间”,超出部分不会完全计费。大约花 30 美元就能使用到 50 美元的 Opus,这只是一个月的使用量(重试一次也能用一天),如果再多就需要额外支付 100-200 美元,看来也不够用。
Antigravity 的优劣
Antigravity 的一个优势是,它来自谷歌,自带 Claude 和 Gemini 的每五小时重置用量。根据我的分析,原始的每五小时用量大约相当于 10 美元的 API,这样算来就相当于购买了价值 100 美元的 Claude 官方订阅,十分划算。此外,通过假学生身份可以免费获得 20 美元的 Pro 订阅,还能邀请最多五个小号加入以获取五倍的使用量。
网上还出现了自动切换小号的程序,我曾一度认为机会来了(我自己拥有三个账号,而网上有些人甚至有几十个账号)。然而:
1. Claude 模型经常出现中断,而 Gemini 却相对稳定,我怀疑谷歌可能故意设置了障碍。
2. 代理设置非常复杂,必须开启全局,否则无法使用,过程相当繁琐。
3. 相比 Cursor,Antigravity 的功能还相对基础,除了 Gemini 的优化稍好,其他方面被 Cursor 完败。
4. 最近似乎由于用户激增,Antigravity 的用量重置从每五小时改为五天或七天,真是让人失望。
总结与展望
Claude Code 作为中转工具、Codex 拼车号为主力
Claude Code 官方和 Codex 官方则是手机端的补充
Cursor 为上述工具的备选,一旦用完就会逐步被淘汰
Antigravity 是候补中的候补
实际上,Codex 还提供了一般的中转站服务,能够一站式解决问题:
https://moacode.org/register?ref=albort=== 彩蛋分割线 ===
撰写这篇帖子之后,我对架构的思考和学习有了显著提升,不再仅仅关注功能的实现。最近一个月,我将新的想法应用于项目核心的重构,基本完成后请 Claude Code 以“顶级架构师”的身份进行评估,Claude 表示:您的系统设计宏伟,机制巧妙,令人印象深刻。
=== 绝对干货 ===
在七万多美元的经验中,我深刻体会到的主要有几个要点(那些小技巧网上随处可见,我只分享深刻的体会):
1. 最基础的是实现 AI 的功能
我在这个层次上徘徊了至少两个月,由于对所需业务的熟悉,虽然过程波折,最终还是完成了任务。
2. 中级层次是让 AI 进行架构设计
旧版本功能实现后,我对它的臃肿及难以维护感到不满,因此咨询 Claude Code 和 Codex 关于架构设计、业务逻辑、代码规范、组件复用和可观测性的得失。
这样每次他们都会从不同的角度指出优缺点,不理解的地方就追问,逐渐拼凑出完整的图景。
包括两个 AI 的手机应用,我也不断提问(ChatGPT 和 Claude 的手机应用都能读取代码并开发聊天项目,可以从不同侧面进行询问,它具有项目记忆功能)。
经过十几天的持续提问,直到每个细节都在脑海中形成最优解。
在此期间,我也理解了什么是 Celery 队列、Redis、数据库迁移、Facade 抽象、P90/P95、如何进行性能监测。同时,我熟练使用 Git 进行分支和版本管理(指令由 AI 提供),现在我正在尝试 PR 和自动测试。
最终,我忍不住让 Claude Code 依据我提问得到的最优解,结合原有功能进行重构,并且是 Codex 实时点评。
这里有一个窍门,千万不要沉迷于提示词技巧,只需简单地告诉它“你是一位顶级架构师……”,它会自然以架构师的视角思考问题。
而且,所有实现都让 Claude Code 和 Codex 去寻找是否有现成的组件可以直接调用,或是否符合现代最佳实践(如果我一开始就注意这一点,可以节省 50% 的工作量)。
因此,新版本程序大幅简化,功能未变却变得更加清晰,测试也能遵循规范进行单元测试、Mock 测试和仿真测试(均在 GitHub 上自动执行)。我觉得自己逐渐摸到了门道。
最后,旧版代码约 6 万行,新版则减少至 4 万行左右(不计共享部分)。
Claude Code 官方还有一个“代码简化”的子智能体,经过几次运行后,可以清理掉许多 AI 修改遗留的痕迹,这样就能够知道当前机制的极限,若要进一步优化,就必须从架构问题入手。
3. 借助 AI 编写代码,更应依赖 AI 查阅资料
当你觉得某个功能复杂时,一定要让 AI 搜索是否有可用的成熟组件,通常会有所发现。此外,让它比较自研方案的优劣,或询问业内对此需求的最佳解决方案,逐渐形成最优做法。
以上是我目前的心得,感谢你的阅读与点赞。


听你说的这么复杂,感觉自己都不敢尝试AI编程了。真心佩服!