揭秘「豆包」深度思考模式：能否超越 DeepSeek？

共计 2608 个字符，预计需要花费 7 分钟才能阅读完成。

字节跳动旗下的 AI 助手豆包目前正在进行深度思考模型的有限测试。豆包的相关负责人向极客公园透露，当前正在试验该公司的不同版本的深度思考模型。

此外，有消息表明，豆包正在测试的深度思考模型是基于其 1.5 基座模型进行研发的。

早在 1 月中旬，豆包的大模型团队在发布豆包 1.5Pro 时，便已宣布开发了深度推理模型
Doubao-1.5-pro-AS1-Preview，并指出其在完全不依赖其他模型数据的情况下，通过强化学习算法的创新和工程优化，充分利用了 Test Time Scaling 的算力优势，完成了 RL Scaling，从而研发出 Doubao 深度思考模式。

经过极客公园的实测，与豆包进行对话时，确实可以观察到其生成的答案开始呈现推理过程中的思维链，但这种现象并不是每次都能稳定出现。目前，豆包的对话页面尚未添加“深度思考”功能的入口。

自 2 月 22 日以来，豆包被腾讯的 AI 应用“腾讯元宝”所超越，位居中国区苹果应用商店免费下载应用中的第三位（第一名仍然是 deepseek）。随着腾讯和百度等多个应用接入 deepseek，字节跳动的豆包将如何应对成为了众人关注的焦点，如今答案逐渐浮出水面。

最早具备深度思考能力的模型是 OpenAI 在 2023 年 12 月发布的 o1 系统，但其采用闭源策略并且仅限付费用户使用（每月收费 200 美元）。而 DeepSeek 则通过开源策略、降低成本以及创新交互，成为首个大规模普及深度思考能力的 AI 公司——DeepSeek 于 2024 年 11 月 20 日推出 R1-Lite-Preview，成为国内首个对标 o1 的推理模型，并于 2025 年 1 月 20 日开源了 R1 模型。

R1 模型的创新之处在于：思维链的透明化；展示完整的推理过程，包括自我质疑、假设验证等拟人化的思考路径；低成本和开源性；R1 模型的推理成本仅为 OpenAI o1 的 1 /27，并且其代码完全开放。

DeepSeek 的深度思考模式是一种通过显性化 AI 模型的推理过程来增强用户理解的功能，而思维链（Chain of Thought, CoT）则是支撑这一模式的核心技术。

简单来说，深度思考模式允许用户直观地看到模型的思考过程，这其中涉及思维链的展示，即 COT（Chain of Thought）——思维链是通过训练模拟出来的，模型被引导输出中间步骤，例如自我质疑和反思，尽管这些只是文本序列，但却看起来像是人类的思考过程。

在深度思考模式下，用户不仅能够获取 AI 的最终答案，还能观察到模型解决问题的完整逻辑链条，包括自我质疑、假设验证、错误修正等步骤。例如，在解答数学题时，模型会展示其从问题拆分、多种方法验证到最终结论的完整过程。

结合实时联网功能后，模型能够抓取最新信息并进行逻辑整合。25 日，Anthropic 推出了 Claude 3.7 Sonnet 混合推理模型，阿里云的 Qwen 推理模型“QwQ-Max 预览版”也相继亮相，我让豆包对此两款推理模型进行了评价：

可以看到豆包找到 9 篇相关资料并进行了“深入思考”|图片

豆包展示了其思考过程|图片

经过思考，豆包对这两款模型给出了评价|图片

思考过程的可见化，使用户能够清晰地理解模型的推理步骤，而不仅仅是最终结果。这样，用户能够感受到模型的决策是有依据的，从而对模型输出的结果增强了信任感。

目前，由于尚在测试阶段，豆包的对话界面中并未显示出「深度思考」功能的入口。在输入消息时，也没有像其他接入了 deepseek 的应用那样提供选择框以决定是否启用该功能。只有少数被选中的用户在提出特定问题时才会激活这个功能。

我同时向豆包和 deepseek 提出了一些问题，想看看两者在「深度思考」方面的表现有何不同。

首先，来看看豆包的思考过程：

在测试过程中，我发现豆包的「深度思考」模式并不总是稳定。第一次询问「9.11 和 9.9 谁大」时，它的回答相对简单：

图片

然而，当我再次询问「9.11 和 9.9 谁大」时，豆包的反应却发生了变化，进入了「深度思考」模式：

豆包深入思考了我为何会重复提问……|图片

可以看出，尽管豆包意识到我之前已有回答，但它依然考虑了我可能未能理解先前的解释，最终提供了判断的方法和结果。

接下来，我们来观察 deepseek 的思考过程：

我们可以发现，尽管表面上这是一个“看似简单”的问题，但 deepseek 的思维过程却显得极为细致，甚至比豆包的分析更加全面。

在这道看似简单的数学题中，豆包和 deepseek 均遵循了小数比较的基本原则，并运用了多种方式进行验证。值得注意的是，豆包在此过程中更加注重教学引导，并考虑到了用户可能出现的误解，而 DeepSeek 则表现出强烈的自我怀疑和反复验证的倾向，使得其思考过程显得更为复杂。

接下来，我们来关注豆包对此问题的回应：

标题：深入探讨 deepseek 的见解

接下来，我们来关注一下 deepseek 所提供的观点：

深度解析：DeepSeek 与豆包的 AI 意识探讨

从 DeepSeek 的回应中，我们能够识别出其结构清晰，内容涵盖科学理论、AI 意识的探讨路径、伦理框架与解决方案四大部分。该回答引用了诸如神经科学、量子理论等领域的相关信息，甚至涉及具体的法律案例和数据。而豆包的回答则更多集中于哲学层面的分类，提及物理主义和二元论等理论，同时探讨了支持与反对 AI 权利的不同观点，但在技术细节上相对较为欠缺。

值得注意的是，两者都意识到关于意识的本质尚无统一意见，且都提及了哲学和科学理论，以及伦理相关的问题。二者的主要区别在于深度和技术细节，DeepSeek 更侧重于技术方向，探讨诸如神经形态计算和量子封印技术等内容，而豆包则更关注于哲学流派和现行伦理指导原则。

通过此次测试，我们初步观察到了豆包在深层思考模式方面的表现。尽管目前仍处于测试阶段，其功能的稳定性和访问权限尚未完全开放，但其对推理过程的初步展现，已经为用户提供了更为直观的理解途径。

来源：今日头条

原文标题：一手实测「豆包」深度思考模式：能超越 DeepSeek 吗？– 今日头条

原文链接：https://toutiao.com/group/7475617558356394537/

声明：

文章来自网络收集后经过 ai 改写发布，如不小心侵犯了您的权益，请联系本站删除，给您带来困扰，深表歉意！

正文完