共计 2386 个字符,预计需要花费 6 分钟才能阅读完成。
刚刚,Anthropic 宣布推出 Claude Haiku 4.5。
让我们简单了解一下,Claude 系列中有三个不同规模的模型:Claude Opus(大杯)、Sonnet(中杯)和 Haiku(小杯)。
此次更新的一个重要亮点在于,小杯的 Claude Haiku 4.5 在保持高性能的基础上,速度更快且价格更低。
五个月之前,Claude Sonnet 4 被认为是顶尖模型之一,而如今新发布的 Haiku 4.5 在编码能力上几乎与其抗衡,然而价格却仅为其三分之一,速度提升了两倍以上。

图表比较前沿模型在 SWE-bench 验证基准上的表现,评估真实世界编码任务的能力。
具体而言,在用于评估人工智能编码能力的测试集 SWE-bench Verified 中,Haiku 4.5 达到了 73% 的成绩,这意味着它与 Claude Sonnet 4 及 OpenAI 最新的 GPT-5 并驾齐驱。
在某些特定任务中,比如电脑操作,Haiku 4.5 甚至超越了前辈 Sonnet 4。
对于需要实时、低延迟处理的场景,例如聊天助手、客服代理或协作编程助手,Haiku 4.5 兼具了高智能和卓越速度,能够提升用户体验。
使用 Claude Code 的开发者们会发现,Haiku 4.5 使得整个编程过程——从多智能体协作到迅速原型开发——变得更加灵活和高效。
当然,尽管两周前发布的 Sonnet 4.5 依然是 Anthropic 的旗舰产品,位列全球编程模型的顶尖行列,但 Haiku 4.5 提供了另一种选择:性能相近,价格却更加实惠。
而且其功能也更加丰富,Sonnet 4.5 能够将复杂问题拆解为多个小任务,指挥一系列 Haiku 4.5 同时进行合作,形成默契配合。
Anthropic针对于 Haiku 4.5 进行了全面的安全性和对齐性测试。
测试结果显示,该模型的不当行为发生频率较低,且较前一版本 Haiku 3.5 的对齐性有明显提升。在自动化对齐评估中,Haiku 4.5 的偏离行为少于 Sonnet 4.5 和 Opus 4.1。
这意味着,它目前是 Anthropic 所有模型中最为安全的选择。

比较流行基准上前沿模型的比较表。
至于定价方面,Haiku 4.5 的费用为:每百万输入 token 1 美元,每百万输出 token 5 美元。
相比之下,GPT-5 mini 的价格约为每百万输入 0.25 美元、输出 2.5 美元,Google 的 Gemini 2.5 Flash 的价格也类似。因此,Haiku 4.5 的定价大约是 GPT-5 mini 或 Flash 的四倍。
然而,与 Sonnet 4.5 相比,其价格降低了大约三倍,而性能几乎无差距,这对于开发者来说无疑是提升效益的机会。
不过,数学似乎并不是它的强项。
知名博主 Dan Shipper 在试用后发现,Haiku 在算数方面有些… 迷失。
例如,在处理 Uber 账单的测试中,Haiku 尽管能准确找到所有相关邮件,但在计算总额时却出现了错误。更尴尬的是,当指出错误后,它承认了——随后又再次犯了同样的错误。
Dan Shipper 对此的评价颇具建设性:
如果你是一名开发者或创业者,并且正在利用 Sonnet 4.5 开发复杂的智能代理程序,那么现在是考虑转向 Haiku 的好时机。这样一来,你将能大幅降低成本,而性能上的损失几乎可以忽略不计。
假如你目前在使用 Gemini 2.5 Flash 或 GPT-5 mini,建议你试试看 Haiku。尽管价格略高,但在需要频繁调用工具并保持自主性的情况下,Haiku 的表现更为优越。

博客链接如下:
https://every.to/vibe-check/vibe-check-claude-haiku-4-5-anthropic-cooked
目前,Claude Haiku 4.5 已经在 Claude Code 及多种应用中正式推出。
开发者能够通过 Claude API、Amazon Bedrock 以及 Google Cloud 的 Vertex AI 直接使用 Haiku 4.5,以替代 Haiku 3.5 和 Sonnet 4,并且价格是 Anthropic 中最具吸引力的选择。

我们参考了@zb1992 的提示,对 Claude 4.5 Haiku 进行了一个时钟演示,整体体验表明,代码生成速度确实显著提升,最终结果也令人满意。
在下文提到的经典推理计算题中,Claude 4.5 Haiku 的响应速度优势尤为明显,这也恰恰展示了轻量级模型在实际应用中的核心竞争力。

另外,根据 The Information 的报道,市值高达 1700 亿美元的 Anthropic 在最近几周已告知投行顾问,计划通过收购来引进更多技术人才,并且拓展除了编程助手之外的其他能力——毕竟编程仍然是其主要收入来源。

知情人士透露,考虑到 Anthropic 在向开发者提供编程类 AI 产品方面取得的成就,公司的下一步可能是拓展至其他开发者常用的软件工具,例如自动化测试代码漏洞的工具,或者辅助软件设计的工具。
此外,还有消息称,Anthropic 可能会通过收购来开发特定行业的解决方案,例如金融、医疗或网络安全等领域,但他们更倾向于进行金额在 5 亿美元以下的小型收购。
Anthropic积极拓展生态系统,助力开发者与用户当前,Anthropic在增强模型能力的同时,也在不断扩展其生态系统。在人工智能行业,竞争愈演愈烈,最终受益的将是开发者和用户——他们将获得更为强大的模型、更加实惠的价格以及更多的选择空间。
作者:莫崇宇
#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),让您第一时间获取更多精彩内容。
爱范儿|原文链接· ·新浪微博

