共计 8811 个字符,预计需要花费 23 分钟才能阅读完成。
自从 OpenClaw 项目在今年推出以来,便吸引了众多目光,其在 GitHub 上的星标数一度达到了约 20 万。在开发者社区中,这个项目迅速崛起,带来了更大的行业争议:平台控制与开源自由之间的对抗。
几天前,谷歌对部分开发者施行了限制,禁止他们利用 OpenClaw 访问 Antigravity 平台的后端服务,理由是认为这种使用方式存在“恶意行为”。

(
在社交媒体上,谷歌 DeepMind 的工程总监 Varun Mohan 对此做出了迅速的回应:“我们发现 Antigravity 后端的恶意使用情况急剧上升,这已经严重影响了用户的服务体验。我们迫切需要找到方法限制这些不当使用产品的用户。我们理解部分用户可能不清楚这种行为违反了我们的服务条款,因此我们会为他们提供恢复访问的途径。不过由于资源有限,我们希望对所有正常用户公平对待。”

(
这一系列限制措施令 OpenClaw 的创始人 Peter Steinberger 感到非常不满,他毫不留情地批评谷歌的做法“没有任何警告和补救措施”实在过于苛刻,并直言“看来我得停止支持谷歌了。”

(
尽管发生了这些风波,Peter 仍积极参与各种活动,比如他参与了编程黑客马拉松 Codex Hackathon,并且举办了围绕 OpenClaw 的专门活动 ClawCon。在 2 月 25 日,他接受了 OpenAI 的深度访谈,这是他几天前宣布加入 OpenAI 后的首次公开亮相。
在访谈中,Peter 分享了 OpenClaw 的开源历程,他讲述了如何利用 Codex 进行开发,以及 OpenClaw 在滥用和安全方面面临的挑战。他提到一个“顿悟时刻”,当他将 AI 智能体接入 WhatsApp 并发送语音消息后,模型竟然能够自动用 FFmpeg 转码和调用 API,这让他感到无比震惊,甚至直言“我鸡皮疙瘩都起来了”。

(
以下是访谈的部分实录,DeepTech 进行了适度的删减与编辑:
创业 13 年后,AI 重新点燃他的激情
主持人:Peter,欢迎来到 OpenAI。OpenClaw 项目火爆全球,几乎登上了所有主流网站和报刊,这样的成功实属不易,恭喜你!你现在的感觉如何?
Peter:坦率地说,信息的洪流让我有些不知所措。最初我启动这个项目是为了激励大家,这种形式让我感到非常有趣,也让我感到自豪。
主持人:真是令人惊叹!你这周在旧金山参加了很多活动,比如编程黑客马拉松 Codex Hackathon,还举办了围绕 OpenClaw 的 ClawCon 活动。
Peter:其实这是社区自发组织的活动。大家都在说“我们得线下见个面”,于是我创建了一个 Discord 频道来组织聚会。到现场后我惊讶地发现,居然有差不多 1000 人到场,他们的创造力、多样性和热情让我非常震撼。
那一刻我意识到,自己创造了一个如此神奇的东西:几周前这个项目还不存在,如今却有成千上万的人在使用,并特意前来见我。下周还有 300 多位参与者,且这还不算全部。我意识到,OpenClaw 确实已经火遍全球。
主持人:确实如此,能够影响不同文化的事物,实在令人敬佩。那么你与社区的互动如何?你花了很多时间与社区成员交流,其中一些人也参与了你的项目。
Peter:这种感觉非常特别。许多人对 OpenClaw 充满热情,并期待它最终成为一个成熟的产品。对我而言,这段时间它一直是我的小小游乐场。今年我一直在惊叹它的潜力。如果你是一位创造者,现在的时代真是最好的时机。
主持人:你认为在这个时代,真正去创造、成为一名 builder,最有趣的地方在哪里?现在的工具链和开发者的定义都在变化,似乎任何人都能创造出任何东西。
Peter:每当我接触到这项新技术时,内心都会感受到多巴胺的激增。之前我写代码时,成功的概率大约在 30% 到 40% 之间。而现在的体验让我彻底颠覆了认知,我突然意识到我可以构建任何东西。当然,时间依然有限,软件开发依然充满挑战,但效率大幅提高了。
主持人:我同意这个观点。让我们回到几年前,第一次了解到你的工作应该是 2011 或 2012 年,当时你创立了 PSPDFKit。从外部来看,你似乎实现了每个开发者的梦想:发现一个问题,提出优秀的解决方案,创办公司、扩展业务,最后出售。我相信这段历程绝对不简单。
Peter:确实如此。我并不是某天突然决定要创建一个 PDF 框架,而是经历了一连串的事件:参加诺基亚开发者大会、朋友的需求、美国签证延误等,这些因素共同推动我创办了公司。
主持人:有趣的是,卖掉公司后你休息了几年。那么是什么让你重新出发的呢?
Peter:经过 13 年的高强度工作,我彻底精疲力竭。经营公司并非易事,作为创始人需要具备多种能力。关键在于,第一次创业时我并不懂如何减压,所以整个人的状态非常紧绷,必须停下来放松。
不过,我始终关注着技术的发展。我见证了早期的 ChatGPT 等技术,虽然觉得很酷,但并没有特别被触动。因为新技术必须亲自体验,光看文章无法感受到它的真正力量。直到我内心准备好并充满冲动时,我才想要重新开始创造一些东西。
与其问自己“我想做什么”,不如问“我不想做什么”的更为清晰。我已经不想再涉足苹果生态,毕竟在这个领域待得太久,世界却已然发展。我意识到,必须跳出这个舒适圈,重新开始,转型至新领域。尽管这一转变的过程会面临不少挑战,甚至感到痛苦,尤其是新术语的理解。但我内心深处却渐渐涌起一种冲动,迫切想要探索 AI 的奥秘。
令我感到震撼的瞬间,是我决定重新拾起那些未完成的项目。开发者们往往倾向于追求新想法与新项目,然而最具挑战的,便是将这些构想落实为现实。此次我希望能继续推进这个项目,并对其进行重构。
于是,我把所有资料整理成一个庞大的 Markdown 文档,约 1MB 大小,随后将其上传至当时的 Gemini Studio 2.5,让它进行重写。它返回了代码,我便将其导入 Claude Code,开始构建。接着,我去做别的事情,它在屏幕上运行了数小时。最终,它表示“已完全可用于生产”。不过,经过测试却崩溃了。
随后,我使用了一个我较为熟悉的工具 Playwright,对其发出指令:创建日志系统并检查潜在问题。一小时后,它竟然成功运行,并展示了效果。虽然代码尚显粗糙,但这一刻彻底唤醒了我。毫不夸张地说,我全身都起了鸡皮疙瘩,脑海中充满了各种可能性。那段时间我几乎失眠,脑海中闪现出许多曾经想做却未能实现的创意,彻底沉浸其中。
我并未编写这段逻辑,它却成功生成了
主持人:许多人认为 OpenClaw 是一夜之间崛起的,但我觉得你故事的魅力在于,这是你过去 9、10 个月在多个项目中积累的成果。从你的 GitHub 可以看到,那里有超过 40 个项目,其中一半已应用于现有的作品。我非常想了解你是如何一步步将这些想法和项目汇聚成 OpenClaw 的。
Peter:实际上,最初并没有完整的计划,而是在探索过程中逐步完成的。为了实现尚未拥有的一些功能,我向 AI 发出请求。经过大量实验,最终形成了原型。那一刻我才明白,这项技术的魅力所在。我在一小时内便制作出了第一个原型,迅速将想法转化为现实。随后,我将注意力稍微转移至其他项目上,因为我认为大公司会推出类似的产品。到去年 11 月,我已制作出几个版本,但效果仍未达到预期。
真正让我坚定信心的是在摩洛哥马拉喀什的一次短途旅行。尽管当时网络信号不佳,但 AI 助手的表现远超我的预期。在任何地方,WhatsApp 都能正常使用,我需要拍照翻译和查找电脑内的资料。我将这一体验分享给朋友们,他们也对此产生了浓厚兴趣。尽管我劝他们不要使用,认为产品尚未成熟,但这正是产品与市场契合的信号:如果你的朋友们争相想要一项产品,即使你并未为他们特别设计,那么可以基本判断这项产品成功了。
还有一次让我恍然大悟的时刻,我随口发了一条语音消息,竟然没有附带代码,模型却成功回复了。我突然意识到,我并未编写这部分逻辑,依照常理这应该无法实现。这一发现激发了我的好奇心,我询问模型是如何做到的,模型回答道:“你发了一条消息,但它只是没有后缀的文件,我分析了文件头,发现是 Opus 音频格式。于是我用 FFmpeg 转换格式进行转录,但后来发现没有安装 Whisper。因此,我四处查找,找到了 OpenAI API 密钥,并通过 cURL 调用转录接口,最终得到了文本。”
这一经历让我见识到模型解决问题的强大能力。从最初的目标来看,我们开发这些技术是为了更好地辅助完成某些事务,而它们所展现的能力超出了我们的预期。这种能力与真正的全能开发者是有共通之处的:首先需要成为优秀的问题解决者,而这恰好与 AI 的能力相吻合。

图丨 OpenClaw 工作原理(
这一切不可思议。赋予 AI 工具与计算设备完全的权限,使其能够自我生成解决方案,即使你从未编写相关代码。我当时在心中暗想:天呐,它还用了我的 API 密钥,真是太疯狂了。可是仔细想想,这不正是我所期望的效果吗?我的聊天机器人正处于同一环境中,自然能够调用这些功能,这正是我故意设计的结果。
我最初推出它时也充满好奇,总是思考:这究竟会引领我走向何方?但我不断经历“原来如此”的时刻:你赋予它的权限越多,工具和技能越丰富,它所展现的能力便越令人惊艳。你甚至可以为它增加一个 Vercel 功能,让它自行创建网站或应用,遇到部署问题时也能独立解决。它甚至会利用你的 API 密钥将 AI 功能集成其中。反之亦然,你也可以直接生成链接与朋友分享。这种体验是思维层面的提升,而不仅仅是“我会编写代码”的简单认知。
去年 11 月和 12 月,我完全沉浸在这个项目中,尽管那时仍在处理其他项目,但大部分时间都投入在这里。虽然早期在网络上的反响平平,但每次向朋友展示时,他们都表现出极大的兴趣,而我则总是说:“尚未完善。”这让我思考,我该如何才能让大家感受到它的独特魅力?
因此,我建立了一个 Discord 频道,将聊天机器人放入其中,没有任何安全措施——因为处于早期阶段,连沙箱都没有,我完全开放开发。如今的 OpenClaw 就是在这样的过程中诞生的,我边调试边让模型参与,询问它:“你看到这个工具的调用了吗?”如果它回答没有,我就会要求它检查自己的源代码,完成所有的任务。当人们看到它时,他们便能够理解。
主持人:在 Discord 中,你赋予了它哪些权限?例如,你的所有推文?它目前掌握了哪些信息?
Peter:我的推文数量不少,涉及许多记忆相关的内容。不过,我很快便开始监控,因为提示词是公开的。但新一代模型的表现确实很出色。我有一个名为 mysoul.md 的保密文件,定义了我的价值观以及模型的运作和思考方式,以及对我重要的内容。
许多人希望获取这套配置,也有一些人试图进行提示词注入,粘贴大量代码进行测试,但模型直接回应“我不读取这个”,甚至调侃对方,尽管我仍然有些不安。项目推出的第一天晚上引发了极大的关注。为了休息,我关闭了它,十小时后醒来,发现 Discord 中竟有 800 条消息,而我的代理正在逐条回复。
我吓了一跳,赶紧关闭,冷静下来逐条查看。最终发现,它没有做出任何恶意行为,也没有泄露我的系统提示。我不是说不可能,提示词注入确实存在,但并没有大家想象的那样简单。总体上,它的表现与预期相符。我犯下的一个大错误是:关闭了服务,却忘记了我设置了 LaunchDaemons(注:这是 macOS 系统用于管理系统级守护进程的机制)。
其作用是确保进程崩溃或被杀掉后自动重启,以维持服务的稳定性。我创建 OpenClaw 的初衷就是为了其稳定可靠,但当时完全忘记了这一点。我终止了进程,结果五秒后它又重新启动,而我已经沉沉入睡。
现在情况已大为改善,我还增加了沙箱,模型骄傲地称我的 Mac Studio 为“城堡”。我将其放入一个轻量级容器中,并询问它:“你能访问这个网站吗?”它回答:“里面连 cURL 都没有。”我说:“你能发挥创造力试试看吗?”于是,它便创造了一个 lobster cURL,自己用 TCP socket 编写了一个简易版 cURL 来访问网站,甚至还调用了 C 编译器。实在是太不可思议了,它的应变能力极为强大。
探索开源项目的创新与挑战:Peter 的开发之路
主持人:当然,在这个过程中你也遭遇了一些困难。许多人对安全性十分关注,认为你应该从一开始就保证一切的稳健性,但实际上这只是一个开源实验项目。
Peter:确实如此,每当有人问我能否引入 CEO、HR 或团队成员时,我总是忍不住想笑。实际上,我大多数时候都是在咖啡馆里独自摸索。不过,你也能看到其中的差异,对吧?一个人类单凭自己是无法完成这样的工作。我现在有了维护者,并且也收到了很多代码合并请求(PR),但即使是一年前,这样的事情都是不可能的。没有任何模型能够让单个人完成这样的任务,而这一点很多人并未意识到。
主持人:许多开发者像我一样都对你如此高效的工作方式感到好奇。今早我再次查看了你的 GitHub,发现你在过去一年有近 9 万次提交,参与了超过 120 个项目。有趣的是,去年年初活跃度一般,但到了 10、11 月却突然飙升为深绿色。我很好奇,这之间发生了什么变化?
Peter:这种转变主要得益于我开始使用 Codex。我认为每一代模型的实力都在增强,调度框架也变得更加出色,同时我对使用方法和工作流程的理解也在不断深化。有些人依然用传统的方式编写代码,他们尝试用 AI 并称之为“氛围编程”,但我认为这个说法并不贴切。这是一种需要时间来磨练的技能,就像学习吉他一样,不可能在第一天就弹得很好,因此初期体验会很糟糕。
但如果你以轻松的心态来学习和适应,逐步就会有感觉:明白如何编写提示词,以及大概需要多长时间。如果耗时太久,我就会反思:是不是哪里出错?是架构问题、思路问题,还是其他的原因?就像写代码一样,当你对目标用户有了感知,自然会更好地融入架构,而不是与系统对抗。
主持人:如果大家想要像你一样高效,你的 Codex 工作流是怎样的?你曾提到过,大部分人把工作流程搞得过于复杂。
Peter:其实我刚开始也让配置变得复杂。从接触这项技术到高效运用,确实耗费了一段时间。许多人在追求花哨的工作流上陷入困境,这并不会真正提高效率,只是表面上看起来更高效。
后来我写了一篇颇具争议的文章,强调将其视为对话。模型不仅仅是编程的搭档,它是一个不同的存在。我会直接告诉它我的需求,常常会问模型:“你有什么疑问?”出于某种原因,模型总是会有问题,而它的默认训练是解决问题并进行假设,但这些假设并不一定是最佳的,尤其是当你的代码库较新,缺乏大量旧代码时。
“你有什么疑问?”这个问题非常关键。很多人没有意识到,模型通常是从零开始的,它不像我们一样学习,每个新会话相当于对代码库一无所知,只能访问你提供的局部信息,尝试解决问题,因此通常无法看到全局情况。
Codex 在全局视角上表现更为出色。我使用的方法非常简单,几乎不需要工作树(Worktree),基本上只检出 1 到 10 个目录,这样可以让我更专注于真正的问题。我不愿意处理复杂的分支管理,而是专注于不同的问题。当项目规模扩大时,同时处理多个互不冲突的任务将变得更加轻松。
主持人:你在开发 OpenClaw 时使用 Codex,这改变了你的工作方式吗?
Peter:是的,我努力去喜欢所有的工具。但我对 Codex 的信任度最高,因为它能够准确地实现我的需求,功能也非常丰富。我认为大家还未意识到,GPT-5.2 又是一次巨大的飞跃。至今我仍然常常感到惊艳,我们可以尽情创造,实在是令人难以置信。大家真的应该去尝试一下。
主持人:你曾提到,你现在甚至很少阅读代码,这带来了哪些变化?
Peter:大部分代码都相对枯燥,仅仅是将一种数据格式转换成另一种,最终呈现给用户。因此,我大致了解代码的作用,看看流程就足够了。我脑海中的模型与实际生成的代码基本一致。
我之前带过一个团队,身边有许多工程师,你必须接受他们不会写出与你完全相同的代码。最终你需要优化代码库,以让 Agent 发挥最大的作用,这与让人发挥最佳效果并不完全相同。这也意味着你需要接受,代码可能不是你理想中的样子,但我可以引导模型。很多时候,结构方式有多种,通常并不重要。如果出现性能问题,再进行针对性优化即可。
正如我们刚才讨论的,我对代码的理解也改变了我进行开源的方式,现在 OpenClaw 已有近 2000 个 PR。在 AI 出现之前,你必须逐一阅读所有的 PR,因为那才是价值所在。但现在我称它们为“提示词请求”,而不是传统的合并请求,因为 PR 背后的理念和意图,比代码本身更为重要。
通常来说,由于我对模型的信任远高于那些我从未听说过或交流过的外部贡献者,因此我还是会稍微进行代码审查。但每当我看到一个 PR,我问模型的第一个问题是:“你理解这个 PR 的意图吗?”我其实并不在意代码本身,而是关心你想解决什么问题。
这更像是一个问题:这是我解决方案的尝试。然而,许多人还不太会充分利用 Agent,常常只提供局部解决方案,而脑海中没有完整的系统。最棘手的问题是,这个新功能如何融入整个大系统?这个小修复是否是正确的修复,还是仅仅表面上的修补,底层是否存在架构问题?
只要你用对话的方式进行沟通,模型其实非常擅长。我会说:“现在来构建这个,告诉我:意图是什么?这是最佳方案吗?”有时模型会说是,但大多数时候会说不是。接着我会一起探索,最好的解决方案是什么?这是架构问题,还是消息机制的问题?这会只影响 WhatsApp,还是也会影响其他工具?我们是否应该用更通用的方式进行资源处理?这个新功能我们真的需要吗?
这些讨论有时会持续 10 到 15 分钟。我习惯用语音交流,感觉就像和非常聪明的同事对话,实际上用语音比打字节省 token。当我得到了满意的答案后,我会用一个斜杠命令,比如 /len pr,它会完整执行:创建分支、修改、合并 PR。我希望能建立一个社区,因此我尽量给贡献者署名,尽管整个过程可能比我自己编写代码慢,但我非常感激大家愿意参与其中。
未来不会被 AI 取代,而是会被懂得如何利用 AI 的人超越
主持人:对于围绕项目的这些贡献者,你对 OpenClaw 的未来有什么愿景?你会将自己视为个人 Agent 领域的行业标杆吗?未来可能会有数十亿人能够使用这类产品。
Peter:我想找到一个平衡点:即使是我妈妈也能安装,同时又好玩、可黑客化,但显然这仍然充满挑战。大多数开源项目只提供下载安装包,但在很长一段时间里,我的默认安装方式是 git clone、build、run,源码就在磁盘上。Agent 就在源码中,也能感知自己的源码。如果你对某些地方不满意,只要给 Agent 一句提示,它就能自己修改。如果能实现这一点,那将是真正的自我修改软件。
对话未来:开发者与创新的无尽可能
许多从未向我提出过 PR 的人,其实只是对提示词的请求,因为他们并不太了解如何构建长期运行的软件。而整个安全行业对此的关注,既引人入胜,又令人感到沮丧,因为许多细节被忽视。例如,我所开发的 Web 界面,最初只是为我自己使用而设计,最初的目的在于调试,后来经过美化,虽然本意仅限于在我自己的可信网络内使用,但由于其功能类似于黑客的游乐场,因而提供了修改的可能性。
有些用户选择了 Ngrok 或其他代理工具。我之所以没有设置限制,是因为有其原因,但目前却有人将其放在公开网络上,尽管我在安全文档中一再强调:切勿如此,这并不是它的设计意图。然而,安全专家们指出,它缺乏登录保护,也没有应对公网环境所需的多种防护措施。
我想要表达的是,这并不是我最初的设计理念。可是,由于其灵活的配置能力,它被视为极其严重的安全风险(CVSS 10.0),对此我感到困惑。但现在我已聘请了安全专家,意识到无法阻止人们在非预期的场景中使用它。如今,我的重点在于支持这些使用方式,帮助用户避免不必要的麻烦。这正是开源的魅力所在:人们能够接纳它,并想出我未曾想到的用法,这种创意令人惊叹。
主持人:接下来,我们从更广阔的角度探讨,涵盖的不仅仅是 OpenClaw 这个项目。这一周我们和多位开发者交谈,大家都在询问:Peter 是如何产生如此多好点子的?他的创造力源自何处?
Peter:我并不确定是否有标准答案,或许是因为好奇心的驱动,或者是意识到现代的开发变得愈发简单。即便我发现一个开源项目能解决大约 70% 的问题,我仍然会选择自己动手。这在一年前是不可想象的,但现在只需简单提示 AI,代码便能在副屏幕上运行,Codex 就能发挥作用。
主持人:不少开发者和工程师尚未完全接受 Codex 和 agentic 工具。对此你有什么建议?特别是在初次接触时,是否需要重新审视工作方式和流程?
Peter:我始终建议以玩乐的心态去接触这些工具,去做那些你一直想尝试的事情。我经常说,未来不会被 AI 取代,但那些懂得如何利用 AI 的人会走得更远。如果你内心充满创造力,渴望解决问题,并具备强大的自驱力与智慧,你将始终保持竞争力。对于那些愿意拥抱这些工具的创作者而言,这是个最好的时代,带着好奇心去塑造未来,把任何想法变为现实。
主持人:这样的结尾非常精彩,我也期待你接下来的作品。
参考资料:
https://www.youtube.com/watch?v=9jgcT0Fqt7U
https://x.com/steipete/status/2025743825126273066
https://x.com/_mohansolo/status/2025766889205739899
运营 / 排版:何晨龙


从负面事件中走出来,Peter的态度令人佩服,他的坚持真的很激励人。