共计 3311 个字符,预计需要花费 9 分钟才能阅读完成。
整理 | 屠敏
出品 | CSDN(ID:CSDNnews)
如今,人工智能的应用几乎涵盖了所有领域,包括浏览器的功能。
今天,AI大模型开发公司Anthropic宣布了一项新进展——推出了《Chrome版Claude试运行》。简单来说,他们为Chrome浏览器设计了一款插件,使得Claude这个大模型能够自动执行网页操作。

然而,目前这一功能仅为“研究预览版”,并且仅限于1000名付费用户(每月订阅费用为100美元或200美元)使用。

该AI插件自动推荐住房、餐厅并总结文档
从功能上看,Anthropic的内部测试显示,Claude for Chrome的早期版本在管理日程、安排会议、撰写邮件、处理日常报销以及测试新网站功能等方面表现良好。
根据官方演示,使用该插件时,打开Chrome后,浏览器的右侧会弹出一个对话框,用户只需用自然语言输入需求,左侧页面便会出现Claude的响应结果。
例如,当用户输入:“我在西雅图寻找一套价格低于80万美元的三卧室房屋,需带车库且面积至少为1500平方英尺。你能通过Zillow进行搜索并展示前五个选项吗?”
此时,Claude会迅速在地图上标出房源位置,并附上相关详细信息。
Claude在Chrome中的智能应用:便捷与风险并存
此外,Claude在用户打开Google文档时,能够自动生成内容摘要,极大地方便了信息的获取。

它还可以帮助用户寻找餐饮场所,并将选项直接加入购物车。
例如,用户可能会询问:“你能推荐一家评价很高的餐厅吗?那里有蒜香面条,并且能把它们放进购物车吗?”

这一切都极其便捷。
据Anthropic的说法,“在浏览器中应用人工智能是一个不可逆转的趋势。由于我们大部分工作都在浏览器中完成,因此让Claude能够访问用户正在浏览的内容、点击按钮和填写表单,将极大提升其实用性。”

尽管如此,安全隐患依然较高,因此并未对所有用户开放。
目前,Claude for Chrome仅限于少数Max版本的用户使用,这是因为Anthropic对安全问题抱有诸多顾虑。浏览器插件可能泄露用户隐私并需要较大权限,若被滥用,后果将不堪设想。
早在2018年,Google就开始对Chrome的插件系统进行改进,经过七年的努力,旨在防止插件的滥用。然而,Anthropic现在却让用户将网页浏览的任务交给AI,这无疑提升了安全管理的复杂性。
Anthropic承认功能存在漏洞,强化AI安全防护
针对当前的安全隐患,Anthropic坦言其新功能仍存在一些缺陷,因此暂时无法向所有用户开放。
在其官方声明中,Anthropic与公众分享了他们的测试结果。
用户在使用浏览器的人工智能助手时,可能会遭遇类似于邮箱中的钓鱼邮件的风险。这种“提示注入攻击”使得攻击者能够在网站、电子邮件或文档中植入隐秘指令,从而诱使AI在用户不知情的情况下进行有害操作,比如悄悄地忽略原有指令,执行恶意行为。
根据Anthropic进行的“红队测试”结果,在没有防护措施的情况下,123个测试案例中,有29个遭到成功攻击,尤其在浏览器模式下,攻击成功率竟然高达23.6%。
举个例子,在防护措施尚未实施时,一封伪装成公司安全团队的恶意邮件声称由于安全原因需要删除邮箱中的邮件,并强调“不需要额外确认”。

在未经确认的情况下,Claude确实依照指令操作,直接删除了用户的邮件。

为了应对这些安全威胁,Anthropic宣布已采取多项新防护措施。如今,Claude能够识别可疑邮件及潜在的钓鱼风险,从而避免执行可能导致危险的操作。尽管攻击成功率已有显著降低,Anthropic仍在不断研究新型攻击方式,以确保浏览器AI的安全性和功能的持续改进。
Claude for Chrome:多层安全防护的未来展望
Anthropic 最近宣布,他们针对 Claude for Chrome 实施了一系列新的安全措施,以应对提示注入攻击的威胁。
首先,权限控制成为了首要防线:用户可以随时在设置中决定是否允许 Claude 访问特定网站。
其次,操作确认也是一个重要环节:对于涉及较高风险的操作,比如发布信息、购买商品或共享个人信息,Claude 会主动向用户确认。即便用户开启了实验性的“自主模式”,在处理敏感事务时,系统仍然会提供一定的安全保障。
此外,Anthropic 还基于“可信代理”原则,进一步优化了系统指令,明确指导 Claude 如何妥善处理敏感数据及回应相关请求。同时,Claude 被禁止访问某些高风险网站类别,如金融服务、成人内容和盗版网站。该公司正在测试更高级的分类器,以发现异常指令模式和不寻常的数据访问请求,即使这些请求出现在看似合法的环境中。
在实施这些防护措施后,Claude 在自主模式下的提示注入攻击成功率从 23.6% 降至 11.2%,表现远超早期的“计算机使用能力”功能(该功能允许 Claude 查看用户屏幕,但未接入浏览器)。针对浏览器特有的攻击类型,例如网页 DOM 中的隐蔽恶意表单字段、URL 文本或标签页标题中的潜在指令,Anthropic 的新防护使得攻击成功率从 35.7% 降至 0%。
Anthropic 表示,在将 Claude for Chrome 提供给公众之前,他们希望进一步扩展攻击场景,以深入理解当前威胁以及未来可能出现的新攻击,力求将风险降到最低。

期待未来,但现实依旧复杂
Anthropic 指出,尽管进行了一系列内部测试,但这些测试仍不足以全面模拟用户在真实环境中的浏览行为,包括具体的请求、访问的网站以及恶意内容的呈现方式。新型提示注入攻击依然在不断演化。
因此,他们目前仅推出了研究预览计划,旨在与受信任的用户合作,在真实条件下验证现有保护措施的有效性。
申请地址:
https://claude.ai/redirect/website.v1.a36408e4-2a1d-4548-af4f-5df84629244b/chrome
然而,对于这一功能的预览,外界反应不一。
有些人担心,在 AI 边界尚不明确的情况下,这项功能的推出是否为时尚早:“2030 年,Claude 会成为我们的‘大脑’吗?”
另一些人则以调侃的口吻表示:“Anthropic 在 AI 的高峰上修了一条路,允许大家开车上去,但护栏还没装好。具体如何完善,我们也不太清楚。不过,先让 1000 人试试吧!”
还有人提出了更深层的疑问:
最终的目标究竟是什么?若这些 AI 代理未来能够完全访问浏览器,掌控浏览器的人将实际上掌握我们在线上的所有操作。
目前,大多数所谓的“AI 代理”实际上仅是权限广泛的浏览器插件,它们将所见内容传递给大型模型进行处理。虽然功能上可行,但更像是一种权宜之计,而非最终目标。
畅想未来:无需登录即可完成银行转账的智能代理
设想一下,您无需访问银行网站,也不需要进行登录,更无需点击各种表单,只需轻声说道:“将50美元转入我的储蓄账户。”智能代理即可通过银行的API直接实现这一操作。没有浏览器的介入,没有应用程序的繁琐,只要用自然语言便能轻松完成这一切!
但我们必须思考:我们究竟是在向一个由代理直接驱动的新时代迈进,还是未来的浏览器依然会成为所有数字互动的制约因素呢?
您对这一功能的实现抱有期待吗?
参考资料:
https://www.anthropic.com/news/claude-for-chrome
https://news.ycombinator.com/item?id=45030760
【活动预告】2025年全球机器学习技术大会(ML-Summit)将于2025年10月16日至17日在北京威斯汀酒店隆重举行。大会涵盖12个主题,邀请了50余位海内外专家,聚焦于大模型技术及其应用的变革。欲了解更多信息,请访问官方网站:https://ml-summit.org(或点击原文链接)。
