共计 2325 个字符,预计需要花费 6 分钟才能阅读完成。
Gemini 2.5 Deep Think 现已正式发布!
然而,有一个不太好的消息是,当前该功能仅向 Gemini Ultra 用户开放。

没错,这个 AI 模型在国际数学奥林匹克(IMO)中获得了官方金牌。
它在全球范围内首次以 4.5 小时的时间,成功解答了 6 道题目中的 5 道,以 35 分的成绩获得金牌。
从去年的银牌到今年的金牌,Gemini 的成长速度实在令人瞩目。
如今,这位“奥数天才”正式加入了你的 Gemini 应用程序。
01|Ultra 用户的独特新工具
今天起,Gemini 应用正式推出 Deep Think 模式。
其功能强大,但门槛不容小觑:仅限于 Gemini Ultra 的用户。
Gemini Ultra 是谷歌在今年 I/O 大会上推出的“高端版”订阅,月费用为 249.99 美元(约合 1800 元),与 ChatGPT Pro、Claude Max 和 SuperGrok Heavy 竞争。
尽管价格不菲,但功能强大,涵盖了最先进的模型、全面的功能,包括 Project Mariner、YouTube 会员以及 30 TB 的谷歌云盘。

要启用 Deep Think 模式,用户需将模型切换至 Gemini 2.5 Pro,然后在输入框下方选择“Deep Think”。
虽然每日有使用限制,但支持更长时间和更复杂的推理输出。
需要强调的是,目前 Ultra 用户可使用的 Deep Think 是 IMO 金牌模型的“变种”,官方表示其速度更快,更适合日常使用。
IMO 金牌模型仅向部分数学家开放体验。
模型的图标设计给人一种“威风凛凛”的感觉。

02|“平行思维”,Deep Think 的关键优势
Deep Think 的核心优势在于其平行思维(Parallel Thinking)能力。
传统的大型模型通常采用链式推理,单一路径深入;而 Deep Think 的思考方式则是:
- 同时开启多个“思维渠道”,并行探索多种解决方案;
- 进行交叉验证,去除错误选项,结合最佳解;
- 延长思考时间,利用更强大的计算能力得出更稳健的最终答案。
谷歌官方用一个形象的比喻来说明:就像人类在解决问题时,常常会先构思几个方案、做草图、推演后,再选择最佳路径。

这种机制在数学、算法设计、科研推理与复杂代码等场景中展现出极大的优势。
最显著的例子便是在今年的 IMO 竞赛中。
- 成功解答了 6 道题目中的 5 道;
- 在 4.5 小时内完成官方答卷;
- 以 35 分的成绩顺利获得金牌,成为首个获得 IMO 官方认可的 AI 金牌得主(补充:OpenAI 的金牌并未获得 IMO 官方认证)。
谷歌还特别强调,Deep Think 在解题过程中全程使用自然语言,不会临时调用代码或使用外部工具。
就连 IMO 的主席也称赞它的解题过程“清晰而精准”。
03|性能卓越,覆盖从数学到编程
Deep Think 不仅能解答奥数题目,更在处理高难度复杂任务方面表现出色。
在相同的创作任务中,谷歌的三款模型结果差异明显。
Gemini 2.5 Flash:就像小学生的作业,虽然可用,但显得有些“寒酸”;Gemini 2.5 Pro:开始展现出一些设计感,地形与细节有所丰富;Gemini 2.5 Deep Think:直接跃升为“艺术家”,细节丰富,场景生动立体。

基准测试结果显示,Deep Think 的表现可以用“碾压”二字形容。
在未使用外部工具的情况下,它在 HLE(人类最后考试)中取得了 34.8% 的最高分,直接超出 OpenAI o3 和“跑分王”Grok 4 近 10%。
在代码和数学方面同样表现惊人,AIME 2025 获得了 99.2% 的高分,几乎满分;而在 IMO 2025 中,它则展现出绝对的优势,把其他模型远远甩在了身后。

04|Deep Think 的应用场景
谷歌官方对 Deep Think 的定位非常明确:它并不是用作闲聊的工具,解决复杂任务才是它的强项。
官方列出了几个典型的应用场景。
1. 设计迭代与创意开发
如果你需要进行复杂的、分步迭代的创意工作,例如网页设计、游戏场景建模或产品原型优化,Deep Think 将充当“多线程创意助手”,首先提出几种方案,然后逐步打磨出最佳解。
在上述案例中,三个版本的“像素风宝塔花园”从
Gemini 2.5 Flash到Deep Think,细节和视觉效果明显提升。
2. 科研推理与数学探索
科研人员是 Deep Think 的另一类核心用户。它擅长处理复杂文献、提出假设并进行推导验证,特别是在数理逻辑和公式推导方面。
谷歌甚至声称,它具有帮助研究者探索数学猜想的潜力,甚至可能加速科学发现的进程。
3. 高难度算法与软件开发
对于程序员来说,Deep Think 不仅能编写代码,更擅长分解问题、算法建模、评估时间与空间复杂度,并逐步逼近优化解。在 LiveCodeBench 等极限环境下也能取得 87.6% 的高分。
总结
ChatGPT 使得 AI 成为日常生活的助理。
而 Deep Think 更加专注于高难度任务与专业工作流程。
对于一般的问答或轻量创作,Gemini Ultra 的 249.99 美元月费或许显得成本过高。
然而,对于科研、算法开发或复杂项目设计而言,Deep Think 将更有可能成为一项值得投资的选择。
我是木易,从事 AI 领域的技术产品管理,拥有国内 Top2 本科和美国 Top10 CS 硕士学位。
我相信 AI 是普通人的“外挂”,力求分享 AI 各方面的知识。这是一个提供最新 AI 科普、工具评测、效率秘籍和行业见解的平台。
欢迎关注“AI 信息 Gap”,让 AI 为你的未来加分。

