共计 1359 个字符,预计需要花费 4 分钟才能阅读完成。
【洞察·TMT】
在 2 月 25 日,人工智能企业 Anthropic
正式推出了市场上首款
混合推理 AI 模型
Claude 3.7 Sonnet
并且提供了免费使用的机会
该模型兼具
标准与扩展两种思维模式
在代码能力等领域卓越表现
同时发布的还有
AI 编程助手 Claude Code

图源:X
结合速度和深度的创新
所谓“混合推理”,意味着
Claude 3.7 Sonnet
是一个具备双重思维模式的模型
将传统大语言模型
与推理模型相结合
Anthropic 表示
他们希望把这两种能力
整合于同一模型中,而不是分开

Claude 3.7 Sonnet 使用演示。图源:Claude
在标准思考模式下,
无需复杂推理即可
迅速给出答案
提供几乎即时的反馈
而在扩展思考模式中,
则能够呈现详细的思考过程
用户能够清楚地观察到
模型如何分析问题并运用逻辑
同时,还能通过 API
精确控制模型的思考时间
在双重思维模式下,
Claude 3.7 Sonnet 引入了
模式切换功能
以优化 AI 的响应速度
但扩展思考模式目前尚未上线

Claude Code 示意图。图源:Anthropic
值得注意的是,不仅是 Claude 3.7 在代码能力上表现卓越,
还大幅超越了 DeepSeek-R1
及 OpenAI 的 o1、o3 模型
与此同时,Anthropic 还推出了
名为 Claude Code 的编码工具
旨在帮助开发者
更加高效地进行编码
引领“混合模型”的新趋势
尽管 OpenAI 的 o1、DeepSeek-R1 等推理模型,
在数学、代码和逻辑推理等方面表现优于传统 AI 大模型,
但它们普遍存在一个短板,
即思考过程较长,响应时间明显
面对复杂问题时,推理模型的思考时间尚可接受,
但在日常对话或信息检索时,
这种等待显然过于漫长
而且推理模型的“幻觉”现象依然存在
这使得用户在“速度”和“深度”之间必须选择不同的模型产品
这正是为何 Claude 3.7 Sonnet 选择了“混合推理”而非简单跟随市场趋势的原因
因为用户普遍不愿在模型选择上花费太多精力,
他们关注的主要是 AI 对话的效果与体验
Anthropic 推出混合推理模式,力争 AI 模型竞争优势 
据 Anthropic 透露,Claude 3.7 Sonnet是市场上独一无二的混合模型。许多业内专家认为,此举将为 Anthropic 在 AI 模型开发的激烈竞争中提供显著优势。如果该公司能够进一步提升动态判断的准确性,并通过 API 使开发者更灵活地调整推理策略,那么混合推理模式或许会成为大型模型发展的标准配置。

OpenAI 的首席执行官 山姆·奥特曼 曾在社交媒体上阐述,该公司的最终目标是开发出一种可以利用各类工具的系统,旨在将 o 系列与 GPT 系列模型整合在一起。这一系统能够判断何时需要深入思考,并广泛适用于不同的任务。据悉,OpenAI 即将推出GPT-5,这将是一个集成 o3 模型及其他多项 OpenAI 技术的综合系统。
(撰文:孔繁鑫 文章部分综合自每日经济新闻、界面新闻、澎湃新闻、ZAKER、腾讯新闻、雷科技)

