共计 8841 个字符,预计需要花费 23 分钟才能阅读完成。
自从 OpenClaw 项目在今年问世以来,它就引起了广泛的关注,其在 GitHub 上的星标数量一度激增至近 20 万。随着该项目在开发者社区的迅速走红,它也引发了一场更为激烈的行业争论:平台管控与开源自由之间的冲突。
就在几天前,谷歌对部分开发者的 OpenClaw 账户进行了限制,原因是他们认为这些账户存在“恶意使用”行为,进而限制了对 Antigravity 平台后端服务的访问。

(
谷歌 DeepMind 的工程总监 Varun Mohan 在社交媒体上对此作出迅速解释:“我们注意到,利用 Antigravity 后端的恶意行为急剧增加,严重影响了用户的服务体验。我们迫切需要一种解决方案,以切断那些不按照预期使用产品的用户的访问权限。我们理解部分用户可能并不清楚他们的行为违反了我们的服务条款,因此我们会为他们提供恢复访问的途径,但由于资源有限,我们希望能够公平对待所有正常用户。”

(
此举引发了 OpenClaw 创始人 Peter Steinberger 的强烈反对,他立即批评谷歌的做法过于苛刻,称“没有任何警告和补救措施”。他更是直言“看来我得停止支持谷歌了。”

(
尽管面临这些波动,Peter 最近的活动依然如火如荼,例如他参加了编程黑客马拉松 Codex Hackathon,并且举办了专门围绕 OpenClaw 的 ClawCon 活动。2 月 25 日,他还接受了 OpenAI 的深度访谈,这是他几天前宣布加入 OpenAI 后的首次亮相。
在访谈中,Peter 谈及了 OpenClaw 的开源旅程、如何利用 Codex 进行开发,以及 OpenClaw 面临的滥用与安全问题。他提到一个“顿悟时刻”,当他将 AI 智能体接入 WhatsApp,发送语音消息后,看到模型自行使用 FFmpeg 转换格式和调用 API 时,他感到一种强烈的变化,表示“我都起鸡皮疙瘩了”。

(
以下是访谈的部分实录,DeepTech 在保持原意的基础上进行了适度的删减和编辑:
经过 13 年的创业,他被 AI 重新激发
主持人:Peter,欢迎来到 OpenAI。OpenClaw 项目在全球范围内掀起了热潮,登上了各大网站和报刊,这种现象十分少见,恭喜你取得如此成功。你现在的感受如何?
Peter:老实说,信息量有些过载,让我感到不太适应。我启动这个项目的初衷是希望能够激励大家,这种形式非常有趣,我为此感到自豪。
主持人:实在了不起。你这一周都在旧金山,参与了一些活动,例如编程黑客马拉松 Codex Hackathon,还举办了围绕 OpenClaw 的 ClawCon 活动。
Peter:其实这是社区自发组织的活动。大家都说“我们得线下聚一聚”,因此我创建了一个 Discord 频道来组织聚会。结果到现场时,我看到大约有 1,000 人到场。他们的创造力、多样性和热情让我震撼。
那一刻我意识到,自己创造了一个奇妙的项目:几周前这个项目还不存在,如今却有成千上万的人在使用它,还特意前来见我。下周还有超过 300 人参与,而这还远不是全部。我意识到,OpenClaw 确实已经风靡全球。
主持人:确实如此,能够影响到不同文化,真的是很了不起。那么你与社区的互动如何?你花了很多时间和社区成员在一起,其中一些人也参与了你的项目。
Peter:这种感觉非常特别。很多人热爱这个项目,对其充满期待,希望它最终能够发展成一个成熟的产品。但对我而言,它曾经很长一段时间只是我的一个小小游乐场。今年我一直在惊叹它的潜力。如果你是一个构建者,现在真的是一个最好的时代。
主持人:在当今时代,真正动手去创造,成为一名构建者,最有趣的地方在哪里?现在的时代很特殊,整个工具链都在变化,开发者的定义也在不断演变,似乎任何人都能创造出任何东西。
Peter:每次接触这项新技术时,我都能感受到内心的激动。以前我写代码的成功率大约只有 30% 到 40%。而如今的体验真的颠覆了我的认知,因为我突然意识到:我可以构建任何东西。尽管时间依然有限,软件开发依旧具备挑战性,但效率显著提升。
主持人:我深表认同。让我们回顾几年前,我第一次了解到你的工作是在 2011 或 2012 年,当时你开发了 PSPDFKit。从外部来看,你似乎实现了每个开发者的梦想:发现一个问题,提供解决方案,成立公司并扩展,最后出售。我相信这段经历绝不是那么简单。
Peter:确实如此。我并不是某天醒来时突然决定“要做一个 PDF 框架”。这实际上是一系列蝴蝶效应的结果:从参加诺基亚开发者大会,到朋友提出需求,再到办理美国签证的延误……这些因素促使我创办了公司。
主持人:有趣的是,卖掉公司后,你休息了几年。是什么促使你重新出发的呢?
Peter:在高强度运转了 13 年后,我当时感到彻底精疲力竭。经营一家公司并不容易,作为创始人需要具备多方面的能力。关键是,第一次创业时,我并不懂得如何缓解压力,因此整个人燃烧得太快,必须停下来调整。
不过,我一直在关注技术。我看到了早期的 ChatGPT 等技术,觉得很酷,但并没有特别打动我。因为新技术必须亲自去体验,仅仅是看文章是无法感受到它的真正力量。直到我准备好,内心也充满冲动时,我才想要再次创造。
与其说我在思考“要做什么”,倒不如说我更清楚“不想做什么”:我不想再涉足苹果生态,因为做了太久,世界也已经向前迈进。这意味着我必须走出舒适区,重新开始,从一个领域的专家转向另一个领域,即使是术语的变化也会让我感到困难——明明积累了丰富的产品经验,却无法直接运用。然后,我决定深入了解这个 AI 到底是什么。
真正震撼我的时刻,是我重新拾起之前未完成的项目。开发者总是喜欢新想法和新项目,但最难的是将它们完成。而我希望继续这个项目,并重新编写。
于是,我将所有内容整理成一个巨大的 Markdown 文件,大约 1MB,并将其拖入当时的 Gemini Studio 2.5,进行重写。它返回了代码,我将其放入 Claude Code 中,然后开始构建。我继续进行其他事务,它在屏幕上连续运行了好几个小时。最后,它说自己“已经 100% 可用于生产”。我尝试了一下,结果崩溃了。
之后,我找了一个我较为熟悉的 MCP 工具 Playwright,对它说:把日志系统做出来,并检查一下问题。一小时后,它真的运行成功了,并展示了效果。虽然代码写得比较粗糙,但那一刻我彻底被唤醒。毫不夸张地说,我“鸡皮疙瘩都起来了”,脑海中充满了无数我曾想做但未能实现的可能性。那段时间我几乎失眠,因为脑海中闪现出太多的创意。然后,我就完全陷入其中了。
我没有写这段逻辑,它却帮我完成了
主持人:许多人认为 OpenClaw 是一夜之间取得成功,但我觉得你故事中最迷人的部分在于,这其实是你过去 9、10 个月几十个项目沉淀的结果。查看你的 GitHub,我发现有 40 多个项目,其中一半都运用到了现在这个作品中。我也非常想了解你这段历程,这些构想和项目是如何一步步汇聚成 OpenClaw 的?
Peter:其实一开始并没有一个明确的规划,很多东西都是在探索的过程中逐渐形成的。为了实现我想要的功能,我不断地向 AI 提问,指导它进行开发。经过一系列实验后,终于呈现了原型,那个瞬间让我意识到这个创意的独特魅力。首次原型的诞生只用了一个小时,瞬间将想法变为现实。随后,我将注意力转向其他项目,心里想着大公司一定会推出类似的产品。到了去年 11 月,我已经制作了好几个版本,但效果仍然不尽如人意。
有一次在摩洛哥马拉喀什短途旅行中,我的信念得到了坚定。当时网络信号较差,但 AI 助手的表现超出了我的预期。WhatsApp 在任何地方都能使用,我需要拍照翻译和查阅电脑资料。与朋友们分享后,他们也表现出浓厚的兴趣。我一度劝他们不要使用,因为产品尚未完善。然而,这正是产品与市场需求契合的明确信号:如果你的朋友们都渴望尝试一款产品,即便它并非专门为他们设计,那就说明这个项目已经具备了成功的潜力。
另一个让我深感震撼的时刻是,我随手发了一条语音消息,竟然得到了模型的回复。那一刻我意识到,我并没有写这部分的逻辑,按理说这根本无法实现。这引发了我的好奇心,我询问模型是如何做到的,模型解释道:“你发送的是没有后缀的文件,我分析了文件头,确认它是 Opus 音频格式。于是我使用 FFmpeg 进行了格式转换,后来发现没有安装 Whisper。经过一番查找,我找到了 OpenAI 的 API 密钥,并用 cURL 调用转录接口,最终获取了文本。”
这一经历让我对这些模型解决问题的能力有了更深刻的理解。从最初的目标来看,我们开发这些技术的初衷是为了更好地支持某些事务,而它们展现出的能力远超我的预期。这种能力与优秀的全能开发者的特质是相通的:首先要具备解决问题的能力,而这正好与 AI 的特性相契合。

图丨 OpenClaw 工作原理(
真是令人惊叹!这正是给予 AI 工具和计算机完全权限的力量,它们能够自行找到解决方案,即便你完全没有编写相关代码。那时我心里想,真不可思议,它竟然使用了我的 API 密钥。但随即我意识到,这正是我设计的初衷。我的聊天机器人和它在同一环境中,自然可以调用这些功能,这并不是坏事,而是我所期待的效果。
在刚发布的时候,我也充满了好奇,想知道这将引导我走向何方。然而,我也不断有“原来如此”的领悟:给予它更多的权限和工具,它的表现就会更加惊艳。你甚至可以为它添加一个 Vercel 技能,让它能够创建网站和应用,部署时也能自行完成。它还可以利用你的 API 密钥增强 AI 功能,反过来,你也能直接生成链接与朋友分享。这是一种思维方式的提升,而不仅仅是“我会写代码”。
在去年 11 月和 12 月,我完全沉浸在这个项目中,尽管当时仍在进行其他项目,但大部分时间都投入于此。尽管早期在网络平台上反响平平,但每当我向朋友展示时,他们都表现出浓厚的兴趣,我却总是说:“还没完善呢。”这让我思考,如何才能让大家真正感受到它的酷炫?
因此,我创建了一个 Discord 频道,将聊天机器人放入其中,初期没有任何安全防护——因为仍处于开发早期,连沙箱都没有,我完全以开放的态度进行开发。如今的 OpenClaw 就是在这样的过程中逐步形成的,一边调试一边让模型参与其中,询问它:“你看到这个工具的调用了吗?”如果它回答没有,那我就会让它检查源码,尝试解决所有问题。当人们看到它的表现时,他们就会明白它的潜力。
主持人:你在 Discord 中给了它哪些权限?例如,你的所有推文?它现在掌握了哪些信息?
Peter:我的推文数量庞大,涉及的记忆内容也不少。不过,我很快开始进行监控,因为提示词部分是公开的。但新一代模型的表现确实非常出色。我有一个名为 mysoul.md 的私密文件,定义了我的价值观、模型运作的方式以及什么对我而言是重要的。
许多人渴望获取这套配置,也有人尝试进行提示词注入,贴上大量代码进行测试,但模型却直接回复“我不读这个”,甚至还会调侃对方。但我仍然有些不安。项目发布后的第一晚便引起了广泛关注。我关掉了系统去睡觉,醒来时发现 Discord 里竟然有 800 条消息,而我的 Agent 正在逐条回复。
我感到震惊,赶紧关闭系统,冷静下来逐条检查。最终发现它没有做任何恶意行为,也没有泄露我的系统提示。我并不是说这种情况不存在,提示词注入的风险是存在的,但没有大家想象得那么简单。总体来看,它的表现符合我的预期。我犯的一个错误是:我关闭了服务,却忘了我设置了 LaunchDaemons(注:这是用于管理 macOS 系统中守护进程的机制)。
其作用是保证进程崩溃或被杀掉时可以自动重启,以确保服务的稳定。创建 OpenClaw 的初衷就是为了稳定可靠,但当时我完全忘记了这个要点。我杀掉了进程,结果 5 秒后它又重启了,而我已经进入了梦乡。
现在情况已经不同,我还增加了沙箱,模型自豪地称我的 Mac Studio 为“城堡”。我将它放入一个轻量容器中,询问:“你能访问这个网站吗?”它回答:“里面连 cURL 都没有。”我便问:“你能发挥创造力试试看吗?”结果它竟然创造了一个 lobster cURL,自己用 TCP socket 编写了简易版 cURL 来访问网站,甚至调用了 C 编译器。这真是令人惊叹,它的应变能力极其强大。
主持人:当然你也遇到了一些挑战。很多人对安全问题非常关注,认为你从一开始就应该做到万无一失,但这毕竟只是一个开源实验项目。
Peter:确实如此,每当有人问我能否把 CEO、HR 或团队成员拉进来时,我总是忍不住想笑。实际上,我大多数时间是在咖啡馆里独自摸索。但你也能看到这种差别,对吧?这是任何人类单靠自己无法完成的任务。如今我有了维护者,并收到了代码合并请求(PR),但即使是一年前,这种事情也不可能实现。没有任何模型能够支持一个人完成如此复杂的项目,大家甚至未曾意识到这一点。
主持人:许多开发者肯定和我一样很好奇:Peter 是如何如此高效的?我今早查看你的 GitHub,过去一年你有近 9 万次提交,参与了 120 多个项目。有趣的是,去年年初你的活跃度还一般,到了 10、11 月却突然激增,变成深绿色。我很好奇,这其中发生了什么?
Peter:变化源于我开始使用 Codex。我认为每一代模型都在不断进步,但不仅是模型本身,调度框架也在改善,我对使用方式和工作流的理解也在提升。有些人依然采用传统方式编写代码,他们尝试 AI 并称之为“vibe coding”,但我认为这个说法并不准确。这是一项需要时间去磨练的技能,就像学习吉他,第一天不可能就弹得很好,所以体验往往会很差。
然而,如果你以一种轻松的心态去学习,逐渐适应,你就会找到感觉:知道怎样编写提示词,预估大概需要多久。如果耗时过长,我就会反思:是不是我出了问题?是架构的问题、思路的问题,还是其他的原因?正如写代码一样,你对目标受众的理解会帮助你更好地融入架构,而不是与系统对抗。
主持人:如果大家想要像你一样高效,现在你的 Codex 工作流是怎样的?你曾提到大多数人把工作流搞得太复杂了。
Peter:其实我一开始也把配置搞得复杂。从接触这项技术到高效使用,确实花费了一段时间。许多人在试图创建复杂的工作流,但这并不会真正提高效率,只是让人有种更高效的错觉。
后来我写了一篇颇具争议的文章,建议将其视为对话。模型不仅仅是编程的伙伴,而是一个不同的存在。我直接表达我的需求,并且总是询问模型:“你有什么问题吗?”出于某些原因,模型总会有疑问,但默认情况下,它是被训练来解决问题的,自己做出假设,而这些假设不一定是最佳的,尤其当你的代码库较新,没有大量旧代码时。
“你有什么问题吗”是一个非常关键的问题。很多人未意识到,模型通常是从零开始的,它不像我们一样学习,每次新会话相当于对这个代码库一无所知,只能搜索你允许它查看的局部内容,尝试解决问题,通常无法看到全局视野。
Codex 在全局视野方面表现得更为出色。我使用的方式非常简单,甚至不需要工作树(Worktree),基本上只检出 1 到 10 个目录,以保持简单,从而让我更专注于真正的问题。我不想处理复杂的分支管理,而是专注于不同的问题。随着项目的扩大,同时处理互不冲突的任务会变得轻松许多。
主持人:使用 Codex 开发 OpenClaw,是否改变了你的工作方式?
Peter:是的,我努力去喜欢所有工具。但我对 Codex 的信任度最高,它能够准确实现我想要的功能,操作起来非常灵活。我认为大家还没有意识到,GPT-5.2 又是一次巨大的飞跃。目前我依然常常被其表现惊艳到,我们可以尽情创造,真是不可思议。大家真的应该去尝试一下。
主持人:你提到过,你现在甚至很少阅读代码,这带来了哪些变化?
Peter:编写代码的过程往往显得单调乏味,主要是将一种数据形式转化为另一种,最终以某种方式展示给用户。因此,我通常能大致了解代码的意图,只需快速浏览一遍流程图即可。我的内心模型与实际生成的代码基本上是相符的。
我曾经带领过一个团队,团队成员中有许多优秀的工程师。我们必须认识到,他们所写的代码未必会与我完全一致。最终目标是优化代码库,以便让 Agent 最大限度地发挥效能,这与人类的最佳表现并不完全相同。这也意味着我们需要接受,代码的风格可能与我心中理想的有所不同,但我能够引导模型进行优化。实际上,代码的结构方式有很多种,一般情况下并不会造成问题。如果真的遇到性能问题,再进行针对性的优化便可。
正如我们刚才讨论的,我对代码的理解也促使我改变了做开源的方式。目前,OpenClaw 已经积累了近 2000 个 PR。在 AI 出现之前,阅读每一条 PR 是必不可少的,因为那是获取价值的关键。然而现在,我更愿意称之为“提示词请求”,因为 PR 背后的理念和意图,比代码本身更为重要。
通常,由于我对模型的信任程度远高于那些我从未接触过的外部贡献者,因此我依然会进行适度的代码审查。但每当我审查一个 PR 时,首先会问模型:你理解这个 PR 的意图吗?我并不在意具体的代码,而是关注它试图解决什么问题。
这实际上是一个问题:这是我提出的解决方案尝试。然而,许多人对 Agent 的使用并不熟练,往往只能提供局部的解决方案,因为他们的思维中缺乏完整的系统概念。最具挑战性的是,如何将这个新功能融入到我的整体系统中?这个小修复是否真正解决了问题,还是仅仅是表面功夫,底层仍然存在架构问题?
只要我们以对话的形式进行交流,模型其实非常擅长。我会说:现在让我们来构建这个,首先告诉我:你的意图是什么?这是最优解吗?有时模型会回答“是”,但大多数情况下它会说“不是”。接下来我会和模型一起探讨,最佳的修复方案是什么?这是架构的问题,还是消息机制的问题?这是否只会影响 WhatsApp,还是也会影响其他工具?我们是否应该采用更通用的资源处理方式?这个新功能真的必要吗?
这样的讨论有时会持续 10 到 15 分钟。我习惯使用语音交流,就像与一个非常聪明的同事对话一样。实际上,语音交流比打字更节省 token。当我得到满意的答案后,我会用一个斜杠命令,比如 /len pr,它会自动执行所有步骤,包括创建分支、修改和合并 PR。我的目标是创建一个社区,因此我尽量将贡献者的名字署名,尽管这个过程可能比我自己完成要慢,但我非常感激大家愿意参与其中。
未来不会被 AI 所取代,而是被那些善于运用 AI 的人所超越
主持人:对于围绕 OpenClaw 项目的贡献者,您对未来的愿景是什么?您会将自己视为个人 Agent 领域的标杆吗?未来可能会有数十亿人能够使用这类产品。
Peter:我希望能找到一种平衡,让即使是我妈妈也能轻松安装,同时又充满乐趣和可黑客化的功能,但显然这是一项艰巨的挑战。大多数开源项目目前只是简单的下载安装包,而我的默认安装方式一直是 git clone、build、run,源代码存储在磁盘中。Agent 与源代码紧密结合,能够感知自身的代码。如果你不喜欢某个地方,只需给 Agent 一句提示,它就能自动修改,这将是真正的自我修改软件。
因此,许多从未向我提交 PR 的人,其实都是在发送提示词请求,因为他们不太懂得如何构建持久化软件。同时,整个安全行业也在关注这个项目,这既有趣又令人沮丧,因为他们往往忽视许多细节。例如,我开发的 Web 界面最初是为了自己调试而设计的。后来我进行了美化,但本意只是在自己的可信网络中使用。然而,由于它也可作为黑客乐园,因此提供了修改选项。
有些用户会使用 Ngrok 或代理。我不设限的原因在于此,但现在有人将其置于公网上,尽管我在安全文档中一再强调:这不是它的设计目的。安全专家会指出,它缺乏登录限制,未具备公网环境所需的各种防护措施。
我想强调的是,我并非为这个场景所设计的。然而,因其灵活性而被认为存在极高的安全风险(CVSS 10.0),这让我感到困扰。但现在,我已经请来了安全专家,我意识到我无法阻止他人将其用于非预期的场景。我的重点在于支持这些使用方式,帮助大家避免误伤。这就是开源的魅力所在:人们可以接受它,想出我未曾想到的用法,这十分美妙。
主持人:接下来,让我们从更宏观的视角讨论,不仅是 OpenClaw 这个项目。我们这周与许多开发者交流时,大家都在询问:Peter 是如何产生如此多优秀想法的?他的创造力来自何处?
Peter:我不确定是否有标准答案,或许是因为好奇心的驱动,或许是意识到如今创造事物变得更简单了。即使我发现一个开源项目能够解决 70% 的问题,我依然会选择自己动手。这在一年前是完全不可能的,但现在只需给 AI 一个提示,代码便能在副屏幕上运行,Codex 也能顺利工作。
主持人:许多开发者和工程师尚未真正接受 Codex 和 Agent 工具。您对他们有什么建议?尤其是在初次接触时,是否需要重新思考工作方式和流程?
Peter:我始终建议:以玩乐的心态去接触,做一件你一直想尝试的事情。我常说,未来不会被 AI 取代,而是会被懂得如何运用 AI 的人所超越。如果你的内心动力是“我想创造、我想解决问题”,并且具备足够的自驱力和智慧,你将永远保持良好的状态。对于那些愿意拥抱这些工具的创作者而言,现如今是最好的时代,带着好奇心来塑造未来,将任何想法变为现实。
主持人:非常感谢,这样的结尾很完美,我期待您未来的作品。
参考资料:
https://www.youtube.com/watch?v=9jgcT0Fqt7U
https://x.com/steipete/status/2025743825126273066
https://x.com/_mohansolo/status/2025766889205739899
运营 / 排版:何晨龙


加入OpenAI真是个大胆的决定,不知道Peter接下来会带来怎样的创新呢?