“AI打工人”OpenClaw真有用吗?深度测评揭示:文件搜索失败、报错频频、邮件发送堵塞,专家称其远不如生产力工具!

共计 4178 个字符,预计需要花费 11 分钟才能阅读完成。

AI 智能体 OpenClaw:真能“接管”你的电脑吗?

最近,AI 智能体工具 OpenClaw 在科技界引起了广泛关注,号称能够“接管电脑、解放双手”。

被誉为“AI 打工人”的 OpenClaw,似乎只需一个指令,便能帮你撰写文章、发送邮件,甚至为你购买咖啡。然而,真相果真如此吗?它究竟是效率工具,还是仅供技术爱好者尝试的“玩物”?

近期,《每日经济新闻》的记者(以下称“每经记者”)与每经科技的开发团队共同进行了全面测试。我们将 OpenClaw 接入了千问 Qwen3-Max、月之暗面 Kimi-K2.5、MiniMax-M2.1、MiniMax-M2.5 和智谱 GLM-4.7 五款国内大模型,此外还包括 OpenAI 的 GPT-5-mini,要求它们完成本地文件检索、网络搜索、稿件撰写及邮件发送等多个环节,旨在揭示这位“指挥官”的真实能力。

测试结果表明,部分模型的表现不尽人意,特别是在浏览器操作方面,如网络搜索和邮件发送,绝大多数都未能成功执行。有专家坦言,目前的 OpenClaw 不仅使用难度高、成本高昂,更可能带来安全隐患。

实测结果对比:GPT-5、MiniMax 和智谱表现良好,而另两款大模型进展缓慢

OpenClaw 并不直接属于大模型,而更像是一个“指挥官”,其职责在于接收用户指令、调用工具并组织流程,而具体的任务则由接入的外部大模型来完成。

因此,接入的大模型的能力、稳定性以及表达方式直接影响任务的成败。

OpenClaw 目前支持的大模型(

为了更贴近实际工作环境,测试人员设定了一项综合测试任务:

要求接入不同大模型的 OpenClaw,在电脑中定位“电车教父”Andy Palmer 的采访速记稿,进行内容总结,并结合网络搜索的信息撰写一篇专访新闻稿,最后通过邮件发送到指定邮箱。

这一任务涉及指令理解、电脑操作本地文件检索、浏览器进行网络信息检索、信息整合与文章写作及应用操作等多个方面。

在首次测试中,各模型的表现差异明显。

OpenClaw+ 千问 Qwen3-Max

首先测试的是千问 Qwen3-Max 模型。在本地文件检索阶段,该模型遇到了困难。即使测试人员明确告知文件位置,Qwen3-Max 经过约 5 分钟的检索后,依然无法准确找到目标文件。

在后续的邮件发送测试中,Qwen3-Max 同样未能完成任务,其只是重复指令而没有实际操作。

OpenClaw+ 月之暗面 Kimi-K2.5

Kimi-K2.5 的表现稍有改善,在 5 分钟内成功检索到文件并完成内容总结。然而,在进行网络搜索以补充行业最新资讯时,由于触发“429 错误”(请求频率过高),未能完成信息检索。

在邮件发送环节,Kimi-K2.5 无法成功操控浏览器向指定邮箱发送邮件。

OpenClaw+MiniMax-M2.1

MiniMax-M2.1 在文件检索、网络搜索和写作方面表现良好。在邮件发送环节,MiniMax-M2.1 在浏览器操作中遇到了一些问题,但它并未停滞不前,而是主动提供了一个可行的解决方案。

测试人员根据其提示进行手动操作,最终成功发送了邮件。

然而,MiniMax-M2.1 发送的邮件仅包含了稿件的“关键引语”,并未附上完整的正文。

OpenClaw+MiniMax-M2.5

尽管同属 MiniMax 系列,2 月 12 日发布的 MiniMax-M2.5 表现明显优于 MiniMax-M2.1,成功完成文件检索、网络搜索和写作,邮件发送环节也无需人工干预。

OpenClaw+ 智谱 GLM-4.7

由于 OpenClaw 尚未接入智谱最新发布的 GLM-5,测试选择了智谱 GLM-4.7。

结果显示,在邮件发送环节,智谱 GLM-4.7 在浏览器中输入了错误的邮箱地址,导致网页访问失败,需要人工干预进行更正。

但在其他环节,智谱 GLM-4.7 的处理速度较快。

OpenClaw+GPT-5-mini

GPT-5-mini 的性能较为稳定且流畅。从文件检索、内容总结、网络搜索、资料补充到邮件发送,整个流程几乎无需人工干预和额外指示,仅在个别时刻出现了网络连接不稳定的情况。

测试揭示 OpenClaw 存在的局限性与风险

为了确保测试准确性,研究团队对整个流程进行了两次重复测试。

第二轮测试总结:

● Kimi-K2.5:成功读取本地文件并获取网络资料,但在 邮件发送环节仍然未能成功,错误信息显示在读取邮箱网络代码及获取输入框节点时发生故障。

千问 Qwen3-max:成功读取文件并补充网络信息,但 在邮件发送时遇到明显延迟,最终未能完成

● MiniMax-M2.1/2.5:顺利完成所有任务流程。

● 智谱 GLM-4.7:顺利完成所有任务流程。

● GPT-5-mini:顺利完成所有任务流程。

第三轮测试总结:

● Kimi-K2.5:成功读取本地文件,但在网络搜索环节出现问题(读取网页内容失败,错误的访问路径,无法理解浏览器控制台指令等),邮件发送环节依然未成功

● 千问 Qwen3-max:成功读取文件,但 无法进行浏览器操作以搜索网络资料,邮件发送环节仍然未能成功

● MiniMax-M2.1/2.5:顺利完成所有任务流程。

● 智谱 GLM-4.7:顺利完成所有任务流程。

● GPT-5-mini:顺利完成所有任务流程。

行业观点:OpenClaw 的能力受限于大模型,尚未成熟为生产力工具

上述测试结果也得到了行业内的广泛认可。

一位程序员表示,他使用 OpenClaw 辅助网店运营、设计宣传物料,通常接入 OpenAI 的 Codex-5.3 和 Gemini 3 Pro 模型,效果远超国产大模型。

多位专业人士和经验丰富的用户指出,OpenClaw 更像是一个“任务框架”,其最终表现高度依赖于所接入的大模型的能力。可以将其比作一个指令明确却能力有限的指挥官,其手下士兵(即大模型)的强弱直接影响到战斗的结果。

非凡产研的负责人宦家臣向记者强调,“模型对 OpenClaw 的影响实际上与任务的复杂度密切相关。国际顶尖模型的上限更高,但对于一般任务,国内的智谱 GLM-4.7 和 Kimi-K2.5 表现也非常出色,尤其是 Claude 的费用过高,让人难以承受。”

尽管一些大模型在测试中展示了执行复杂任务的潜力,OpenClaw 在成为合格生产力工具的道路上仍显得遥不可及。

“我个人觉得,目前版本的 OpenClaw 并不算是一个合格的生产力工具。”前小米 OS AI 产品专家、现出海 AI 应用公司 ExcelMaster.ai 创始人张和在接受采访时坦言,OpenClaw 在某种程度上是之前流行的程序员工具 Anthropic 旗下 Claude Code 的“外壳”,尽管通过聊天界面和内置技能进行了更好的封装,降低了使用门槛,但在核心能力上仍未突破。“我没发现 OpenClaw 有特别之处,与 Claude Code 相比并没有明显优势,查询资料的能力也逊色不少。”

“只要大模型的能力再提升一点,OpenClaw 就会变得更好,也会更加普及。即便它什么都不做,只需静待更新的大模型发布……OpenClaw 的使用门槛就会下降。”张和补充道,OpenClaw 的进步与普及本质上是在等待底层大模型技术的突破。

Akamai 云与 AI 产品经理张璐博士也表达了相似的看法。他指出,OpenClaw 若要真正实现生产力,必须经过二次开发和调优,因为目前版本仍显得“有些不成熟,常常会出现卡顿现象”。

高门槛、高成本和高风险阻碍普通用户使用

除了对大模型能力的依赖外,技术门槛、使用成本及安全风险,使得 OpenClaw 目前难以普及到普通用户。

首先,部署和使用的门槛较高。OpenClaw 并未提供简单的“一键安装”方案,用户需通过命令行在电脑上完成本地配置、依赖管理及权限设置。每经科技的开发人员表示,整个过程对用户的技术背景有一定要求,至少需要基本的开发经验,这无疑让大多数非技术人员望而却步。虽然阿里云、腾讯云和亚马逊云等云服务商提供了 OpenClaw 的云端部署服务,并声称可以轻松在其配置的服务器上使用,但云端版本的 OpenClaw 并不能控制用户本地计算机。

高昂的使用成本也是一个现实问题。因为 OpenClaw 在执行任务时频繁调用大模型,token 消耗量极大,可谓是“token 消耗器”。有用户向记者表示,使用智谱 GLM-4.7 模型仅与其交互 20 多次,就花费了 200 元。

张璐博士也提到,在使用 DeepSeek 模型时,他一天的消耗可达数十元。如果更换为能力更强的模型,账单将更加可怕,“一天几百元的支出是常态”。

高成本使得许多用户只能选择接入更便宜或免费的模型,但这又影响了 OpenClaw 的实际表现。有用户向记者反映,由于成本问题选择了 Qwen-8B 模型,结果 OpenClaw 总是只能回答问题,而无法执行操作。

比高门槛和高成本更令人担忧的是内在的安全风险。OpenClaw 的功能定位为“完成任务”而非“聊天”,这就需要获得较高的系统权限,以操控本地文件和应用。

思科 AI 威胁研究与安全团队主管 Amy Chang 直言,从安全的角度来看,OpenClaw“简直是一场噩梦”,它能够在用户的计算机上随意执行 shell 命令、读写文件和运行脚本。这种高级权限若被错误配置或恶意指令利用,后果将不堪设想。

网络安全公司 Dvuln 的创始人 Jamieson O’Reilly 也证实了这种风险,他发现 OpenClaw 存在漏洞,攻击者可以通过这些漏洞获取用户数月内的私人消息、账户凭证、API 密钥等敏感信息。更令人恐惧的是,为了方便 AI 执行任务而存储的银行账户、加密货币钱包 API 等信息,可能以明文形式保存在本地文件中,一旦被黑客入侵,“一瞬间就能掏空用户的资产”。

OpenClaw 的开发者 Peter Steinberger 也承认,这只是一个免费的开源业余项目,需要用户进行详细配置以确保安全。他明确表示:“它并不适合非技术用户。”

免责声明:本文内容与数据仅供参考,不构成投资建议,使用前请核实。据此操作,风险自担。

每日经济新闻

来源:百家号
原文标题:号称“AI 打工人”的 OpenClaw 值得用吗?每经深度实测:找不到文件、搜索报错、发邮件卡死!专家:远非生产力工具
声明:
文章来自网络收集后经过 ai 改写发布,如不小心侵犯了您的权益,请联系本站删除,给您带来困扰,深表歉意!
正文完
 0
小智
版权声明:本站原创文章,由 小智 于2026-04-01发表,共计4178字。
转载说明:除特殊说明外本站文章皆由CC-4.0协议发布,转载请注明出处。
使用智语AI写作智能工具,您将体验到ChatGPT中文版的强大功能。无论是撰写专业文章,还是创作引人入胜的故事,AI助手都能为您提供丰富的素材和创意,激发您的写作灵感。您只需输入几个关键词或主题,AI便会迅速为您生成相关内容,让您在短时间内完成写作任务。
利用AI智能写作工具,轻松生成高质量内容。无论是文章、博客还是创意写作,我们的免费 AI 助手都能帮助你提升写作效率,激发灵感。来智语AI体验 ChatGPT中文版,开启你的智能写作之旅!
评论(6 条评论)
自在小猫 评论达人 LV.1
2026-04-01 13:35:26 回复

看了测试结果,觉得OpenClaw还需要更多时间来优化其功能,现阶段不太推荐使用。

     未知
小熊鹿 评论达人 LV.1
2026-04-01 13:25:26 回复

有些功能在测试中表现不佳,建议先观察一段时间再决定是否使用。

     未知
团子兔 评论达人 LV.1
2026-04-01 13:15:26 回复

用起来还是有点麻烦,很多操作都得手动完成,看起来并不省事。

     未知
林林甜 评论达人 LV.1
2026-04-01 13:05:26 回复

如果连基本的文件检索都做不好,那这个AI打工人还有什么用呢?

     未知
盐慢夏 评论达人 LV.1
2026-04-01 12:55:26 回复

我倒是觉得这种AI工具能否上手,关键还在于用户的技术能力。

     未知
星河子 评论达人 LV.1
2026-04-01 12:45:26 回复

从测试来看,OpenClaw的功能似乎不如预期,是否会影响人们对AI工具的信任?

     未知
利用智语AI写作工具,轻松生成高质量内容。无论是文章、博客还是创意写作,我们的免费 AI 助手都能帮助你提升写作效ai率,激发灵感。来智语AI体验ChatGPT中文版,开启你的智能ai写作之旅!
6