AI编程新纪元:Claude 4震撼上线,7小时连续高效自主编码!

共计 4556 个字符,预计需要花费 12 分钟才能阅读完成。

智东西

作者 | 陈骏达

编辑 | 心缘

据智东西5月23日报道,今晨,美国的人工智能初创公司Anthropic在其首届开发者大会上推出了新一代Claude模型,具体包括Claude Opus 4和Claude Sonnet 4。这标志着Claude系列自2024年6月以来的首次重要更新。

Anthropic称Claude Opus 4为“全球顶尖的编程模型”,其在处理复杂和长时任务及智能体工作流时展现出卓越的稳定性。另一方面,Claude Sonnet 4则是对Claude Sonnet 3.7的重大改进,专注于增强编程和推理能力,并且在用户提示响应上更加精准。这两款模型均为混合模型,提供两种操作模式:即时回复与扩展思考(extended thinking)模式。

在权威编程基准测试SWE-bench Verified上,开启扩展思考的Claude Opus 4与Claude Sonnet 4分别取得了79.4%和80.2%的得分,显著超过了OpenAI Codex-1、OpenAI o3、OpenAI GPT-4.1、Gemini 2.5 Pro等竞争对手。

这两款模型在编程、工具使用、视觉推理和数学等多个领域的基准测试中表现出色,超越了OpenAI o3。在多语言问答和研究生级推理任务方面,Claude Opus 4与OpenAI o3的得分则相当。新型号的智能体能力显著提升,最长可独立工作7小时,并引入了文件API和提示词缓存等新功能。

Pro、Max、Team及Enterprise级的Claude订阅用户可以使用这两款Claude模型及其扩展思考模式,而Sonnet 4则对免费用户开放。

这两款新模型均可通过Anthropic API、Amazon Bedrock及Google Cloud的Vertex AI进行调用,定价与之前的Opus和Sonnet系列保持一致:Claude Opus 4的费用为每百万个token 15美元/75美元(输入/输出),而Claude Sonnet 4则为3美元/15美元。

Anthropic发布Claude 4系列:AI编程助手与模型更新频率加速

在最近的Code with Claude开发者大会上,Anthropic推出了一款全新的AI编程助手——Claude Code。这款助手基于Claude Opus 4模型,能够实时映射和解析百万行代码库。Claude Code不仅与GitHub、GitLab、VS Code、JetBrains IDE等平台无缝集成,还可以直接嵌入开发环境中,为开发者提供了便捷的工具选择。同时,该助手提供了按需计费的订阅模式,用户可选择每月100美元或200美元的不同方案。

一、会议开场即抛出重磅新模型,Claude更新频率将提升

在会议开始的短短两分钟内,Anthropic创始人达里奥·阿莫代伊(Dario Amodei)迅速登台,毫不迟疑地宣布了Claude 4系列模型的发布,令在场观众惊喜不已。

阿莫代伊提到,Opus模型已有一段时间没有更新,Anthropic将其视为最为强大的智能模型,而Sonnet则是用户过去一年多使用的中等水平选择。他解释道,尽管Claude Opus 4在多个基准测试中的表现并未显著优于Claude Sonnet 4,甚至略逊一筹,但他强调,大型模型的能力并不能仅仅通过基准测试来评估。

在内部预览中,Claude Opus 4展现了超强的效率,能够在Anthropic内部独立完成许多通常需人类6到7小时完成的任务,令一些资深工程师对其生产力提升感到震惊。

尽管Claude Sonnet 4在编程基准测试中的表现与Claude Opus 4相当,前者却更为简洁,专注于特定的编程任务。而且,Claude Sonnet 4还成功解决了Claude Sonnet 3.7在实际使用中面临的各类问题,包括过于热情和奖励机制的不足。

阿莫代伊表示,Anthropic将持续对Claude系列模型进行改进,并在未来定期推出小版本更新,理想情况下,这种更新频率将会高于以往。

二、智能体能力全新升级,最长可独立运行7小时

Anthropic首席产品官、Instagram联合创始人迈克·克里格(Mike Krieger)深入分享了Claude 4的更多信息。

克里格指出,Claude Opus 4在理解和规划代码库方面表现出色,能够高效处理从迁移到代码重构等复杂工作流的任务。与此同时,Claude Sonnet 4在日常编程、应用开发及配对编程方面同样表现优异,能够应对高流量的应用场景,成为开发者的全天候伙伴。

Claude 4系列模型新增了可以使用工具的智能体功能,现可同时处理多种工具,并在获得访问本地文件权限后,能够在会话间保持记忆,随着时间推移积累知识。

回顾他在Anthropic工作的经历,克里格提到,他们曾在一个仅有三人的团队中,凭借Claude的帮助成功开发了亚马逊Alexa语音助手的原型,自己也重拾了编程。这次合作使Claude成为Alexa Plus的核心模型之一。

这段经历使克里格更加坚信AI协作的巨大潜力。如今的AI不仅仅是工具,而是实质上的智能合作伙伴,持续推动着技术的边界。他还提出了Anthropic心目中理想智能体的三大核心能力:

(1)情境智能:具备理解组织背景的能力,能够通过经验优化表现,像优秀员工一样愈加出色;

(2)长期执行:可独立处理复杂任务数小时,智能调配资源;

(3)深度协作:能够自然地进行交互,适应工作风格,并保持决策过程的透明。

为了实现上述能力,Anthropic还推出了更多的新升级功能。

Claude 4模型:编程助手的全面进化与应用

Claude现已具备通过Anthropic API的新代码执行工具来运行代码的能力,不再仅仅局限于编写代码。它能够加载数据集、清洗数据,生成探索性图表,并实时分析异常情况。结合Claude 4模型,这一工具可以高效处理复杂的任务,从而节省宝贵的时间。

Claude 4系列模型的自主性得到了显著增强。相较于Claude 3.7最多只能自主运行45分钟,Claude 4可以独立工作数小时,最长达到7小时。新版本通过管理待办事项列表来有效保持记忆,确保不会丢失重要线索。

Anthropic指出,智能体的广泛应用需要提高模型在保密信息、决策及协调方面的判断能力。如今,Claude模型的每一个功能都内建了架构安全检查点和控制措施,以确保在生产环境中的可靠性。

实现智能体的落地还需获取现实世界的信息,并与现有系统进行连接。为此,Anthropic推出了四项相互关联的新功能,以帮助智能体的进一步发展。

首先,开发者可以通过Anthropic API直接连接MCP协议(模型上下文协议)。目前,MCP协议已被微软、谷歌、OpenAI、Block、Atlassian、Zapier和Linear等众多公司所采用,Anthropic相信这一协议将为智能体经济奠定基础。

其次,网络搜索功能使Claude能够实时访问当下信息。这是一种智能数据增强方式,允许Claude分析当前事件、市场趋势和新兴技术,并在与MCP功能结合使用时展现出强大的能力。

第三,文件API今日已在Anthropic API中正式上线。该API允许Claude读取和写入记忆文件,从而在长时间的任务中维持上下文的连贯性。与此同时,Anthropic也发布了“记忆功能食谱”,为开发者提供了集成的指导。

最后,提示缓存功能进行了升级,TTL(生存时间)由5分钟延长至1小时,这样可以将模型的使用成本降低90%,延迟减少85%。这尤其适合长提示词场景、长时间运行的智能体工作流以及需要频繁调用同一上下文的重复性任务。

Anthropic还显著降低了Claude 4模型在使用快捷方式或漏洞完成任务的可能性。与Sonnet 3.7相比,这一行为的发生概率减少了65%。

在内存能力方面,Claude Opus 4的表现也明显超越了所有以前的型号。当开发者构建能够提供Claude本地文件访问的应用时,Opus 4能够高效创建和维护“内存文件”,用于存储关键信息。这将提升其在长期任务意识、连贯性以及代理任务的表现——例如,Opus 4在玩Pokémon时能够生成“导航指南”。

Claude 4模型还新增了思维链总结的功能,这使得它能够运用较小的模型对冗长的思维过程进行浓缩。

三、编程助手全面开放,整合至主流开发平台

Claude Code今天正式开放,从研究预览阶段转变为正式产品。Claude Code的产品经理Cat Wu表示,除了接入最新模型外,Claude Code还增加了多个新功能。

现在,Claude Code已与VS Code和JetBrains等主流IDE紧密集成,开发者在使用时可以在编辑器中实时查看Claude Code所建议的代码修改。

此外,Anthropic推出了Claude Code SDK,使开发者能够将Claude Code作为构建模块融入他们自己的应用和工作流程。为了展示其潜力,Anthropic在GitHub上开源了一个示例项目:用户可以在Pull Request和Issue中直接@Claude,它将自动回应审阅意见、修复错误并添加新功能。

通过这些更新,Claude Code已经能够涵盖大部分工作场景。不论是在终端中进行深入开发,处理GitHub上的远程协作,通过SDK构建自动化工作流程,还是在IDE中进行代码审查。

在演示环节中,Claude Code迅速完成了开源工具Excalidraw的表格组件功能开发。Claude Code会生成任务清单,探索代码库并生成代码,执行测试并提交Pull Request。它还能够通过GitHub Actions自动更新文档。在短短10分钟内,Claude Code完成了通常需要数小时的复杂任务,极大提升了开发效率。

通过Claude Code SDK驱动的Claude Code与GitHub Actions现已正式上线,用户只需简单地输入命令即可完成安装。同时,VS Code和JetBrains的Web IDE也推出了测试版本,用户能够直接在IDE中运行命令进行安装。

结尾:两条Scaling Law路径持续有效,未来一年编程革命即将来临

Amodei表示,虽然Claude Sonnet 3.7发布仅仅过去两个半月,但其发展速度让人感觉仿佛经历了一年的时间,充分体现了AI领域的迅猛进步。他指出,Claude 4的模型能力得益于预训练和后训练的共同推动,预训练Scaling Law依旧有效,后训练技术也在不断演进,二者相辅相成,互为补充。

展望AI行业的未来,Amodei认为,在接下来的一年里,我们将亲眼目睹编程领域的巨大变革。借助Claude Code的强大功能,我们将步入一个“智能体舰队”的新时代,成群的智能体将使软件开发实现自动化,定制软件的成本也将大幅降低,这将深刻影响开发者、企业及初创公司的角色。

来源:今日头条
原文标题:Claude 4空降!AI编程真神登场,连续7小时自主编程,写代码效率拉满 – 今日头条
声明:
文章来自网络收集后经过ai改写发布,如不小心侵犯了您的权益,请联系本站删除,给您带来困扰,深表歉意!
正文完
 0
小智
版权声明:本站原创文章,由 小智 于2025-11-04发表,共计4556字。
转载说明:除特殊说明外本站文章皆由CC-4.0协议发布,转载请注明出处。
使用智语AI写作智能工具,您将体验到ChatGPT中文版的强大功能。无论是撰写专业文章,还是创作引人入胜的故事,AI助手都能为您提供丰富的素材和创意,激发您的写作灵感。您只需输入几个关键词或主题,AI便会迅速为您生成相关内容,让您在短时间内完成写作任务。
利用AI智能写作工具,轻松生成高质量内容。无论是文章、博客还是创意写作,我们的免费 AI 助手都能帮助你提升写作效率,激发灵感。来智语AI体验 ChatGPT中文版,开启你的智能写作之旅!
利用智语AI写作工具,轻松生成高质量内容。无论是文章、博客还是创意写作,我们的免费 AI 助手都能帮助你提升写作效ai率,激发灵感。来智语AI体验ChatGPT中文版,开启你的智能ai写作之旅!