Claude模型重磅发布：性能翻倍、价格大幅降低，编程实力直追GPT-5！

没有评论

共计 2386 个字符，预计需要花费 6 分钟才能阅读完成。

刚刚，Anthropic 宣布推出 Claude Haiku 4.5。

让我们简单了解一下，Claude 系列中有三个不同规模的模型：Claude Opus（大杯）、Sonnet（中杯）和 Haiku（小杯）。

此次更新的一个重要亮点在于，小杯的 Claude Haiku 4.5 在保持高性能的基础上，速度更快且价格更低。

五个月之前，Claude Sonnet 4 被认为是顶尖模型之一，而如今新发布的 Haiku 4.5 在编码能力上几乎与其抗衡，然而价格却仅为其三分之一，速度提升了两倍以上。

图表比较前沿模型在 SWE-bench 验证基准上的表现，评估真实世界编码任务的能力。

具体而言，在用于评估人工智能编码能力的测试集 SWE-bench Verified 中，Haiku 4.5 达到了 73% 的成绩，这意味着它与 Claude Sonnet 4 及 OpenAI 最新的 GPT-5 并驾齐驱。

在某些特定任务中，比如电脑操作，Haiku 4.5 甚至超越了前辈 Sonnet 4。

对于需要实时、低延迟处理的场景，例如聊天助手、客服代理或协作编程助手，Haiku 4.5 兼具了高智能和卓越速度，能够提升用户体验。

使用 Claude Code 的开发者们会发现，Haiku 4.5 使得整个编程过程——从多智能体协作到迅速原型开发——变得更加灵活和高效。

当然，尽管两周前发布的 Sonnet 4.5 依然是 Anthropic 的旗舰产品，位列全球编程模型的顶尖行列，但 Haiku 4.5 提供了另一种选择：性能相近，价格却更加实惠。

而且其功能也更加丰富，Sonnet 4.5 能够将复杂问题拆解为多个小任务，指挥一系列 Haiku 4.5 同时进行合作，形成默契配合。

Anthropic针对于 Haiku 4.5 进行了全面的安全性和对齐性测试。

测试结果显示，该模型的不当行为发生频率较低，且较前一版本 Haiku 3.5 的对齐性有明显提升。在自动化对齐评估中，Haiku 4.5 的偏离行为少于 Sonnet 4.5 和 Opus 4.1。

这意味着，它目前是 Anthropic 所有模型中最为安全的选择。

比较流行基准上前沿模型的比较表。

至于定价方面，Haiku 4.5 的费用为：每百万输入 token 1 美元，每百万输出 token 5 美元。

相比之下，GPT-5 mini 的价格约为每百万输入 0.25 美元、输出 2.5 美元，Google 的 Gemini 2.5 Flash 的价格也类似。因此，Haiku 4.5 的定价大约是 GPT-5 mini 或 Flash 的四倍。

然而，与 Sonnet 4.5 相比，其价格降低了大约三倍，而性能几乎无差距，这对于开发者来说无疑是提升效益的机会。

不过，数学似乎并不是它的强项。

知名博主 Dan Shipper 在试用后发现，Haiku 在算数方面有些… 迷失。

例如，在处理 Uber 账单的测试中，Haiku 尽管能准确找到所有相关邮件，但在计算总额时却出现了错误。更尴尬的是，当指出错误后，它承认了——随后又再次犯了同样的错误。

Dan Shipper 对此的评价颇具建设性：

如果你是一名开发者或创业者，并且正在利用 Sonnet 4.5 开发复杂的智能代理程序，那么现在是考虑转向 Haiku 的好时机。这样一来，你将能大幅降低成本，而性能上的损失几乎可以忽略不计。

假如你目前在使用 Gemini 2.5 Flash 或 GPT-5 mini，建议你试试看 Haiku。尽管价格略高，但在需要频繁调用工具并保持自主性的情况下，Haiku 的表现更为优越。