“AI打工人”OpenClaw真有用吗？深度测评揭示：文件搜索失败、报错频频、邮件发送堵塞，专家称其远不如生产力工具！

共计 4178 个字符，预计需要花费 11 分钟才能阅读完成。

AI 智能体 OpenClaw：真能“接管”你的电脑吗？

最近，AI 智能体工具 OpenClaw 在科技界引起了广泛关注，号称能够“接管电脑、解放双手”。

被誉为“AI 打工人”的 OpenClaw，似乎只需一个指令，便能帮你撰写文章、发送邮件，甚至为你购买咖啡。然而，真相果真如此吗？它究竟是效率工具，还是仅供技术爱好者尝试的“玩物”？

近期，《每日经济新闻》的记者（以下称“每经记者”）与每经科技的开发团队共同进行了全面测试。我们将 OpenClaw 接入了千问 Qwen3-Max、月之暗面 Kimi-K2.5、MiniMax-M2.1、MiniMax-M2.5 和智谱 GLM-4.7 五款国内大模型，此外还包括 OpenAI 的 GPT-5-mini，要求它们完成本地文件检索、网络搜索、稿件撰写及邮件发送等多个环节，旨在揭示这位“指挥官”的真实能力。

测试结果表明，部分模型的表现不尽人意，特别是在浏览器操作方面，如网络搜索和邮件发送，绝大多数都未能成功执行。有专家坦言，目前的 OpenClaw 不仅使用难度高、成本高昂，更可能带来安全隐患。

实测结果对比：GPT-5、MiniMax 和智谱表现良好，而另两款大模型进展缓慢

OpenClaw 并不直接属于大模型，而更像是一个“指挥官”，其职责在于接收用户指令、调用工具并组织流程，而具体的任务则由接入的外部大模型来完成。

因此，接入的大模型的能力、稳定性以及表达方式直接影响任务的成败。

OpenClaw 目前支持的大模型（

为了更贴近实际工作环境，测试人员设定了一项综合测试任务：

要求接入不同大模型的 OpenClaw，在电脑中定位“电车教父”Andy Palmer 的采访速记稿，进行内容总结，并结合网络搜索的信息撰写一篇专访新闻稿，最后通过邮件发送到指定邮箱。

这一任务涉及指令理解、电脑操作本地文件检索、浏览器进行网络信息检索、信息整合与文章写作及应用操作等多个方面。

在首次测试中，各模型的表现差异明显。

● OpenClaw+ 千问 Qwen3-Max

首先测试的是千问 Qwen3-Max 模型。在本地文件检索阶段，该模型遇到了困难。即使测试人员明确告知文件位置，Qwen3-Max 经过约 5 分钟的检索后，依然无法准确找到目标文件。

在后续的邮件发送测试中，Qwen3-Max 同样未能完成任务，其只是重复指令而没有实际操作。

● OpenClaw+ 月之暗面 Kimi-K2.5

Kimi-K2.5 的表现稍有改善，在 5 分钟内成功检索到文件并完成内容总结。然而，在进行网络搜索以补充行业最新资讯时，由于触发“429 错误”（请求频率过高），未能完成信息检索。

在邮件发送环节，Kimi-K2.5 无法成功操控浏览器向指定邮箱发送邮件。

● OpenClaw+MiniMax-M2.1

MiniMax-M2.1 在文件检索、网络搜索和写作方面表现良好。在邮件发送环节，MiniMax-M2.1 在浏览器操作中遇到了一些问题，但它并未停滞不前，而是主动提供了一个可行的解决方案。

测试人员根据其提示进行手动操作，最终成功发送了邮件。

然而，MiniMax-M2.1 发送的邮件仅包含了稿件的“关键引语”，并未附上完整的正文。

● OpenClaw+MiniMax-M2.5

尽管同属 MiniMax 系列，2 月 12 日发布的 MiniMax-M2.5 表现明显优于 MiniMax-M2.1，成功完成文件检索、网络搜索和写作，邮件发送环节也无需人工干预。

● OpenClaw+ 智谱 GLM-4.7

由于 OpenClaw 尚未接入智谱最新发布的 GLM-5，测试选择了智谱 GLM-4.7。

结果显示，在邮件发送环节，智谱 GLM-4.7 在浏览器中输入了错误的邮箱地址，导致网页访问失败，需要人工干预进行更正。

但在其他环节，智谱 GLM-4.7 的处理速度较快。

● OpenClaw+GPT-5-mini

GPT-5-mini 的性能较为稳定且流畅。从文件检索、内容总结、网络搜索、资料补充到邮件发送，整个流程几乎无需人工干预和额外指示，仅在个别时刻出现了网络连接不稳定的情况。

测试揭示 OpenClaw 存在的局限性与风险

为了确保测试准确性，研究团队对整个流程进行了两次重复测试。

第二轮测试总结：

● Kimi-K2.5：成功读取本地文件并获取网络资料，但在 邮件发送环节仍然未能成功，错误信息显示在读取邮箱网络代码及获取输入框节点时发生故障。

● 千问 Qwen3-max：成功读取文件并补充网络信息，但 在邮件发送时遇到明显延迟，最终未能完成；

● MiniMax-M2.1/2.5：顺利完成所有任务流程。

● 智谱 GLM-4.7：顺利完成所有任务流程。

● GPT-5-mini：顺利完成所有任务流程。

第三轮测试总结：

● Kimi-K2.5：成功读取本地文件，但在网络搜索环节出现问题（读取网页内容失败，错误的访问路径，无法理解浏览器控制台指令等），邮件发送环节依然未成功。

● 千问 Qwen3-max：成功读取文件，但 无法进行浏览器操作以搜索网络资料，邮件发送环节仍然未能成功。

● MiniMax-M2.1/2.5：顺利完成所有任务流程。

● 智谱 GLM-4.7：顺利完成所有任务流程。

● GPT-5-mini：顺利完成所有任务流程。

行业观点：OpenClaw 的能力受限于大模型，尚未成熟为生产力工具

上述测试结果也得到了行业内的广泛认可。

一位程序员表示，他使用 OpenClaw 辅助网店运营、设计宣传物料，通常接入 OpenAI 的 Codex-5.3 和 Gemini 3 Pro 模型，效果远超国产大模型。

多位专业人士和经验丰富的用户指出，OpenClaw 更像是一个“任务框架”，其最终表现高度依赖于所接入的大模型的能力。可以将其比作一个指令明确却能力有限的指挥官，其手下士兵（即大模型）的强弱直接影响到战斗的结果。

非凡产研的负责人宦家臣向记者强调，“模型对 OpenClaw 的影响实际上与任务的复杂度密切相关。国际顶尖模型的上限更高，但对于一般任务，国内的智谱 GLM-4.7 和 Kimi-K2.5 表现也非常出色，尤其是 Claude 的费用过高，让人难以承受。”

尽管一些大模型在测试中展示了执行复杂任务的潜力，OpenClaw 在成为合格生产力工具的道路上仍显得遥不可及。

“我个人觉得，目前版本的 OpenClaw 并不算是一个合格的生产力工具。”前小米 OS AI 产品专家、现出海 AI 应用公司 ExcelMaster.ai 创始人张和在接受采访时坦言，OpenClaw 在某种程度上是之前流行的程序员工具 Anthropic 旗下 Claude Code 的“外壳”，尽管通过聊天界面和内置技能进行了更好的封装，降低了使用门槛，但在核心能力上仍未突破。“我没发现 OpenClaw 有特别之处，与 Claude Code 相比并没有明显优势，查询资料的能力也逊色不少。”

“只要大模型的能力再提升一点，OpenClaw 就会变得更好，也会更加普及。即便它什么都不做，只需静待更新的大模型发布……OpenClaw 的使用门槛就会下降。”张和补充道，OpenClaw 的进步与普及本质上是在等待底层大模型技术的突破。

Akamai 云与 AI 产品经理张璐博士也表达了相似的看法。他指出，OpenClaw 若要真正实现生产力，必须经过二次开发和调优，因为目前版本仍显得“有些不成熟，常常会出现卡顿现象”。

高门槛、高成本和高风险阻碍普通用户使用

除了对大模型能力的依赖外，技术门槛、使用成本及安全风险，使得 OpenClaw 目前难以普及到普通用户。

首先，部署和使用的门槛较高。OpenClaw 并未提供简单的“一键安装”方案，用户需通过命令行在电脑上完成本地配置、依赖管理及权限设置。每经科技的开发人员表示，整个过程对用户的技术背景有一定要求，至少需要基本的开发经验，这无疑让大多数非技术人员望而却步。虽然阿里云、腾讯云和亚马逊云等云服务商提供了 OpenClaw 的云端部署服务，并声称可以轻松在其配置的服务器上使用，但云端版本的 OpenClaw 并不能控制用户本地计算机。

高昂的使用成本也是一个现实问题。因为 OpenClaw 在执行任务时频繁调用大模型，token 消耗量极大，可谓是“token 消耗器”。有用户向记者表示，使用智谱 GLM-4.7 模型仅与其交互 20 多次，就花费了 200 元。

张璐博士也提到，在使用 DeepSeek 模型时，他一天的消耗可达数十元。如果更换为能力更强的模型，账单将更加可怕，“一天几百元的支出是常态”。

高成本使得许多用户只能选择接入更便宜或免费的模型，但这又影响了 OpenClaw 的实际表现。有用户向记者反映，由于成本问题选择了 Qwen-8B 模型，结果 OpenClaw 总是只能回答问题，而无法执行操作。

比高门槛和高成本更令人担忧的是内在的安全风险。OpenClaw 的功能定位为“完成任务”而非“聊天”，这就需要获得较高的系统权限，以操控本地文件和应用。

思科 AI 威胁研究与安全团队主管 Amy Chang 直言，从安全的角度来看，OpenClaw“简直是一场噩梦”，它能够在用户的计算机上随意执行 shell 命令、读写文件和运行脚本。这种高级权限若被错误配置或恶意指令利用，后果将不堪设想。

网络安全公司 Dvuln 的创始人 Jamieson O’Reilly 也证实了这种风险，他发现 OpenClaw 存在漏洞，攻击者可以通过这些漏洞获取用户数月内的私人消息、账户凭证、API 密钥等敏感信息。更令人恐惧的是，为了方便 AI 执行任务而存储的银行账户、加密货币钱包 API 等信息，可能以明文形式保存在本地文件中，一旦被黑客入侵，“一瞬间就能掏空用户的资产”。

OpenClaw 的开发者 Peter Steinberger 也承认，这只是一个免费的开源业余项目，需要用户进行详细配置以确保安全。他明确表示：“它并不适合非技术用户。”

免责声明：本文内容与数据仅供参考，不构成投资建议，使用前请核实。据此操作，风险自担。

每日经济新闻

来源：百家号

原文标题：号称“AI 打工人”的 OpenClaw 值得用吗？每经深度实测：找不到文件、搜索报错、发邮件卡死！专家：远非生产力工具

原文链接：https://baijiahao.baidu.com/s?id=1857888176635541160

声明：

文章来自网络收集后经过 ai 改写发布，如不小心侵犯了您的权益，请联系本站删除，给您带来困扰，深表歉意！