Claude模型重磅发布:性能翻倍、价格大幅降低,编程实力直追GPT-5!

共计 2386 个字符,预计需要花费 6 分钟才能阅读完成。

刚刚,Anthropic 宣布推出 Claude Haiku 4.5。

让我们简单了解一下,Claude 系列中有三个不同规模的模型:Claude Opus(大杯)、Sonnet(中杯)和 Haiku(小杯)。

此次更新的一个重要亮点在于,小杯的 Claude Haiku 4.5 在保持高性能的基础上,速度更快且价格更低

五个月之前,Claude Sonnet 4 被认为是顶尖模型之一,而如今新发布的 Haiku 4.5 在编码能力上几乎与其抗衡,然而价格却仅为其三分之一,速度提升了两倍以上。

图表比较前沿模型在 SWE-bench 验证基准上的表现,评估真实世界编码任务的能力。

具体而言,在用于评估人工智能编码能力的测试集 SWE-bench Verified 中,Haiku 4.5 达到了 73% 的成绩,这意味着它与 Claude Sonnet 4 及 OpenAI 最新的 GPT-5 并驾齐驱。

在某些特定任务中,比如电脑操作,Haiku 4.5 甚至超越了前辈 Sonnet 4。

对于需要实时、低延迟处理的场景,例如聊天助手、客服代理或协作编程助手,Haiku 4.5 兼具了高智能和卓越速度,能够提升用户体验。

使用 Claude Code 的开发者们会发现,Haiku 4.5 使得整个编程过程——从多智能体协作到迅速原型开发——变得更加灵活和高效。

当然,尽管两周前发布的 Sonnet 4.5 依然是 Anthropic 的旗舰产品,位列全球编程模型的顶尖行列,但 Haiku 4.5 提供了另一种选择:性能相近,价格却更加实惠。

而且其功能也更加丰富,Sonnet 4.5 能够将复杂问题拆解为多个小任务,指挥一系列 Haiku 4.5 同时进行合作,形成默契配合。

Anthropic针对于 Haiku 4.5 进行了全面的安全性和对齐性测试。

测试结果显示,该模型的不当行为发生频率较低,且较前一版本 Haiku 3.5 的对齐性有明显提升。在自动化对齐评估中,Haiku 4.5 的偏离行为少于 Sonnet 4.5 和 Opus 4.1。

这意味着,它目前是 Anthropic 所有模型中最为安全的选择。

比较流行基准上前沿模型的比较表。

至于定价方面,Haiku 4.5 的费用为:每百万输入 token 1 美元,每百万输出 token 5 美元。

相比之下,GPT-5 mini 的价格约为每百万输入 0.25 美元、输出 2.5 美元,Google 的 Gemini 2.5 Flash 的价格也类似。因此,Haiku 4.5 的定价大约是 GPT-5 mini 或 Flash 的四倍。

然而,与 Sonnet 4.5 相比,其价格降低了大约三倍,而性能几乎无差距,这对于开发者来说无疑是提升效益的机会。

不过,数学似乎并不是它的强项。

知名博主 Dan Shipper 在试用后发现,Haiku 在算数方面有些… 迷失。

例如,在处理 Uber 账单的测试中,Haiku 尽管能准确找到所有相关邮件,但在计算总额时却出现了错误。更尴尬的是,当指出错误后,它承认了——随后又再次犯了同样的错误。

Dan Shipper 对此的评价颇具建设性:

如果你是一名开发者或创业者,并且正在利用 Sonnet 4.5 开发复杂的智能代理程序,那么现在是考虑转向 Haiku 的好时机。这样一来,你将能大幅降低成本,而性能上的损失几乎可以忽略不计。

假如你目前在使用 Gemini 2.5 Flash 或 GPT-5 mini,建议你试试看 Haiku。尽管价格略高,但在需要频繁调用工具并保持自主性的情况下,Haiku 的表现更为优越。

博客链接如下:
https://every.to/vibe-check/vibe-check-claude-haiku-4-5-anthropic-cooked

目前,Claude Haiku 4.5 已经在 Claude Code 及多种应用中正式推出。

开发者能够通过 Claude API、Amazon Bedrock 以及 Google Cloud 的 Vertex AI 直接使用 Haiku 4.5,以替代 Haiku 3.5 和 Sonnet 4,并且价格是 Anthropic 中最具吸引力的选择。

我们参考了@zb1992 的提示,对 Claude 4.5 Haiku 进行了一个时钟演示,整体体验表明,代码生成速度确实显著提升,最终结果也令人满意。

在下文提到的经典推理计算题中,Claude 4.5 Haiku 的响应速度优势尤为明显,这也恰恰展示了轻量级模型在实际应用中的核心竞争力。

另外,根据 The Information 的报道,市值高达 1700 亿美元的 Anthropic 在最近几周已告知投行顾问,计划通过收购来引进更多技术人才,并且拓展除了编程助手之外的其他能力——毕竟编程仍然是其主要收入来源。

知情人士透露,考虑到 Anthropic 在向开发者提供编程类 AI 产品方面取得的成就,公司的下一步可能是拓展至其他开发者常用的软件工具,例如自动化测试代码漏洞的工具,或者辅助软件设计的工具。

此外,还有消息称,Anthropic 可能会通过收购来开发特定行业的解决方案,例如金融、医疗或网络安全等领域,但他们更倾向于进行金额在 5 亿美元以下的小型收购。

Anthropic积极拓展生态系统,助力开发者与用户

当前,Anthropic在增强模型能力的同时,也在不断扩展其生态系统。在人工智能行业,竞争愈演愈烈,最终受益的将是开发者和用户——他们将获得更为强大的模型、更加实惠的价格以及更多的选择空间。

作者:莫崇宇

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),让您第一时间获取更多精彩内容。

爱范儿|原文链接· ·新浪微博

来源:今日头条
原文标题:Claude「最香」模型发布,速度翻倍价格大砍,编程能力直逼 GPT-5 – 今日头条
声明:
文章来自网络收集后经过ai改写发布,如不小心侵犯了您的权益,请联系本站删除,给您带来困扰,深表歉意!
正文完
 0
小智
版权声明:本站原创文章,由 小智 于2025-12-30发表,共计2386字。
转载说明:除特殊说明外本站文章皆由CC-4.0协议发布,转载请注明出处。
使用智语AI写作智能工具,您将体验到ChatGPT中文版的强大功能。无论是撰写专业文章,还是创作引人入胜的故事,AI助手都能为您提供丰富的素材和创意,激发您的写作灵感。您只需输入几个关键词或主题,AI便会迅速为您生成相关内容,让您在短时间内完成写作任务。
利用AI智能写作工具,轻松生成高质量内容。无论是文章、博客还是创意写作,我们的免费 AI 助手都能帮助你提升写作效率,激发灵感。来智语AI体验 ChatGPT中文版,开启你的智能写作之旅!
利用智语AI写作工具,轻松生成高质量内容。无论是文章、博客还是创意写作,我们的免费 AI 助手都能帮助你提升写作效ai率,激发灵感。来智语AI体验ChatGPT中文版,开启你的智能ai写作之旅!