揭秘「豆包」深度思考模式:能否超越 DeepSeek?

共计 2608 个字符,预计需要花费 7 分钟才能阅读完成。

字节跳动旗下的 AI 助手豆包目前正在进行深度思考模型的有限测试。豆包的相关负责人向极客公园透露,当前正在试验该公司的不同版本的深度思考模型。

此外,有消息表明,豆包正在测试的深度思考模型是基于其 1.5 基座模型进行研发的。

早在 1 月中旬,豆包的大模型团队在发布豆包 1.5Pro 时,便已宣布开发了深度推理模型
Doubao-1.5-pro-AS1-Preview,并指出其在完全不依赖其他模型数据的情况下,通过强化学习算法的创新和工程优化,充分利用了 Test Time Scaling 的算力优势,完成了 RL Scaling,从而研发出 Doubao 深度思考模式。

经过极客公园的实测,与豆包进行对话时,确实可以观察到其生成的答案开始呈现推理过程中的思维链,但这种现象并不是每次都能稳定出现。目前,豆包的对话页面尚未添加“深度思考”功能的入口。

自 2 月 22 日以来,豆包被腾讯的 AI 应用“腾讯元宝”所超越,位居中国区苹果应用商店免费下载应用中的第三位(第一名仍然是 deepseek)。随着腾讯和百度等多个应用接入 deepseek,字节跳动的豆包将如何应对成为了众人关注的焦点,如今答案逐渐浮出水面。

1 豆包也在探索“深度思考”?

最早具备深度思考能力的模型是 OpenAI 在 2023 年 12 月发布的 o1 系统,但其采用闭源策略并且仅限付费用户使用(每月收费 200 美元)。而 DeepSeek 则通过开源策略、降低成本以及创新交互,成为首个大规模普及深度思考能力的 AI 公司——DeepSeek 于 2024 年 11 月 20 日推出 R1-Lite-Preview,成为国内首个对标 o1 的推理模型,并于 2025 年 1 月 20 日开源了 R1 模型。

R1 模型的创新之处在于:思维链的透明化;展示完整的推理过程,包括自我质疑、假设验证等拟人化的思考路径;低成本和开源性;R1 模型的推理成本仅为 OpenAI o1 的 1 /27,并且其代码完全开放。

DeepSeek 的深度思考模式是一种通过显性化 AI 模型的推理过程来增强用户理解的功能,而思维链(Chain of Thought, CoT)则是支撑这一模式的核心技术。

简单来说,深度思考模式允许用户直观地看到模型的思考过程,这其中涉及思维链的展示,即 COT(Chain of Thought)——思维链是通过训练模拟出来的,模型被引导输出中间步骤,例如自我质疑和反思,尽管这些只是文本序列,但却看起来像是人类的思考过程。

在深度思考模式下,用户不仅能够获取 AI 的最终答案,还能观察到模型解决问题的完整逻辑链条,包括自我质疑、假设验证、错误修正等步骤。例如,在解答数学题时,模型会展示其从问题拆分、多种方法验证到最终结论的完整过程。

结合实时联网功能后,模型能够抓取最新信息并进行逻辑整合。25 日,Anthropic 推出了 Claude 3.7 Sonnet 混合推理模型,阿里云的 Qwen 推理模型“QwQ-Max 预览版”也相继亮相,我让豆包对此两款推理模型进行了评价:

可以看到豆包找到 9 篇相关资料并进行了“深入思考”|图片

豆包展示了其思考过程|图片

经过思考,豆包对这两款模型给出了评价|图片

思考过程的可见化,使用户能够清晰地理解模型的推理步骤,而不仅仅是最终结果。这样,用户能够感受到模型的决策是有依据的,从而对模型输出的结果增强了信任感。

2 豆包与 deepseek,谁优谁劣

目前,由于尚在测试阶段,豆包的对话界面中并未显示出「深度思考」功能的入口。在输入消息时,也没有像其他接入了 deepseek 的应用那样提供选择框以决定是否启用该功能。只有少数被选中的用户在提出特定问题时才会激活这个功能。

我同时向豆包和 deepseek 提出了一些问题,想看看两者在「深度思考」方面的表现有何不同。

经典数学难题:9.11 与 9.9,哪个更大?

首先,来看看豆包的思考过程:

在测试过程中,我发现豆包的「深度思考」模式并不总是稳定。第一次询问「9.11 和 9.9 谁大」时,它的回答相对简单:

图片

然而,当我再次询问「9.11 和 9.9 谁大」时,豆包的反应却发生了变化,进入了「深度思考」模式:

豆包深入思考了我为何会重复提问……|图片

可以看出,尽管豆包意识到我之前已有回答,但它依然考虑了我可能未能理解先前的解释,最终提供了判断的方法和结果。

接下来,我们来观察 deepseek 的思考过程:

深入探讨:意识的本质与 AI 自我意识的未来

我们可以发现,尽管表面上这是一个“看似简单”的问题,但 deepseek 的思维过程却显得极为细致,甚至比豆包的分析更加全面。

在这道看似简单的数学题中,豆包和 deepseek 均遵循了小数比较的基本原则,并运用了多种方式进行验证。值得注意的是,豆包在此过程中更加注重教学引导,并考虑到了用户可能出现的误解,而 DeepSeek 则表现出强烈的自我怀疑和反复验证的倾向,使得其思考过程显得更为复杂。

哲学探讨:意识的本质与 AI 自我意识的可能性

接下来,我们来关注豆包对此问题的回应:

标题:深入探讨 deepseek 的见解

接下来,我们来关注一下 deepseek 所提供的观点:

深度解析:DeepSeek 与豆包的 AI 意识探讨

从 DeepSeek 的回应中,我们能够识别出其结构清晰,内容涵盖科学理论、AI 意识的探讨路径、伦理框架与解决方案四大部分。该回答引用了诸如神经科学、量子理论等领域的相关信息,甚至涉及具体的法律案例和数据。而豆包的回答则更多集中于哲学层面的分类,提及物理主义和二元论等理论,同时探讨了支持与反对 AI 权利的不同观点,但在技术细节上相对较为欠缺。

值得注意的是,两者都意识到关于意识的本质尚无统一意见,且都提及了哲学和科学理论,以及伦理相关的问题。二者的主要区别在于深度和技术细节,DeepSeek 更侧重于技术方向,探讨诸如神经形态计算和量子封印技术等内容,而豆包则更关注于哲学流派和现行伦理指导原则。

通过此次测试,我们初步观察到了豆包在深层思考模式方面的表现。尽管目前仍处于测试阶段,其功能的稳定性和访问权限尚未完全开放,但其对推理过程的初步展现,已经为用户提供了更为直观的理解途径。

来源:今日头条
原文标题: 一手实测「豆包」深度思考模式:能超越 DeepSeek 吗?– 今日头条
声明:
文章来自网络收集后经过 ai 改写发布,如不小心侵犯了您的权益,请联系本站删除,给您带来困扰,深表歉意!
正文完
 0
小智
版权声明:本站原创文章,由 小智 于2025-10-12发表,共计2608字。
转载说明:除特殊说明外本站文章皆由CC-4.0协议发布,转载请注明出处。
使用智语AI写作智能工具,您将体验到ChatGPT中文版的强大功能。无论是撰写专业文章,还是创作引人入胜的故事,AI助手都能为您提供丰富的素材和创意,激发您的写作灵感。您只需输入几个关键词或主题,AI便会迅速为您生成相关内容,让您在短时间内完成写作任务。
利用AI智能写作工具,轻松生成高质量内容。无论是文章、博客还是创意写作,我们的免费 AI 助手都能帮助你提升写作效率,激发灵感。来智语AI体验 ChatGPT中文版,开启你的智能写作之旅!
利用智语AI写作工具,轻松生成高质量内容。无论是文章、博客还是创意写作,我们的免费 AI 助手都能帮助你提升写作效ai率,激发灵感。来智语AI体验ChatGPT中文版,开启你的智能ai写作之旅!