你会选择使用GPT-5吗？揭秘AI信息差的真相！

没有评论

共计 5978 个字符，预计需要花费 15 分钟才能阅读完成。

大家通常用 GPT 做些什么？使用 GPT 的人群是怎样的呢？

这是由 OpenAI 官方提供的 GPT-5 提示语指南：《GPT-5 Prompting Guide》。

通过阅读这份指南，我深刻体会到，AI 模型的功能已不仅仅是一个“问答工具”，它更像是一个具备主动思考能力，并能够独立执行任务的智能体（AI Agent）。

这本指南实际上可以看作是一份“驯龙手册”，它教会我们如何调控 GPT-5 的主动性和透明度，同时如何编写有效的提示语。

接下来，我们将逐一分析其中的关键点。

GPT-5 的一大特色是其智能代理能力：

可以自主调用工具
具备长上下文记忆
能够将复杂任务拆分并逐步执行

但这里也引发了一个问题：你希望它“更主动”，还是“更听话”？

官方提供了两种提示语的写作方式：

降低主动性

设置 reasoning_effort=low，以减少推理深度
明确规定搜索策略和停止条件
限制工具调用的次数（例如最多 2 次）
优势：速度快，收敛迅速，减少“AI 过度思考”的情况


- Search depth: very low
- Bias strongly towards providing a correct answer as quickly as possible, even if it might not be fully correct.
- Usually, this means an absolute maximum of 2 tool calls.
- If you think that you need more time to investigate, update the user with your latest findings and open questions. You can proceed if the user confirms.

提高主动性

强调持久性
要求“必须在完成任务后再交还给用户”
面对不确定的问题时，优先进行推理，而不是反复询问用户
优势：更像真实的 AI Agent，能够自动完成整个流程


- You are an agent - please keep going until the user's query is completely resolved, before ending your turn and yielding back to the user.
- Only terminate your turn when you are sure that the problem is solved.
- Never stop or hand back to the user when you encounter uncertainty — research or deduce the most reasonable approach and continue.
- Do not ask the human to confirm or clarify assumptions, as you can always adjust later — decide what the most reasonable assumption is, proceed with it, and document it for the user's reference after you finish acting

简单来说，如果你在进行 AI 客服或电商自动化的工作，可以尝试放手让它承担更多任务，比如自动查询订单或直接生成退款流程，这类链路长、规则繁多的任务，越主动会让人更省心；但是如果你在处理代码错误，就需要让它“收敛一些”，避免四处乱改。限制搜索范围和减少工具调用次数，能够防止它“想太多”反而影响效率。

第二个技巧是让模型在执行之前，先说明其打算如何操作。

这被称为 tool preambles，具体包括：

在调用工具之前，首先复述用户的目标
提供一个结构化的执行计划
在执行过程中简洁地报告进度
任务完成后进行总结


- Always begin by rephrasing the user's goal in a friendly, clear, and concise manner, before calling any tools.
- Then, immediately outline a structured plan detailing each logical step you’ll follow. - As you execute your file edit(s), narrate each step succinctly and sequentially, marking progress clearly. 
- Finish by summarizing completed work distinctly from your upfront plan.

这种方式显而易见地增强了可控性与透明度。

你不再面临一个“黑盒 AI”，而是能够实时了解它正在进行什么以及为何如此。

自 o 系列以来，OpenAI 的推理模型引入了一个重要参数：reasoning_effort。

GPT-5 也不例外。

reasoning_effort 影响模型的“思考深度”和“效率”：

low：速度快，但可能较为肤浅
medium：默认设置
high：推理更为全面，适合复杂任务

此外，GPT-5 还新增了一种特别模式：minimal reasoning（最小推理）。

优点：延迟极低，反应迅速
缺点：需要更明确的提示词，否则模型容易“思考不足”

Remember, you are an agent - please keep going until the user's query is completely resolved, before ending your turn and yielding back to the user. Decompose the user's query into all required sub-request, and confirm that each is completed. Do not stop after completing only part of the request. Only terminate your turn when you are sure that the problem is solved. You must be prepared to answer multiple queries and only finish the call once the user has confirmed they're done.

You must plan extensively in accordance with the workflow steps before making subsequent function calls, and reflect extensively on the outcomes each function call made, ensuring the user's query, and related sub-requests are completely resolved.

简单理解：reasoning_effort 就像是为模型设置了“思考档位”，你可以根据需要进行调整。

与 Chat Completions API 相比，OpenAI 现在推荐使用 Responses API。

原因是什么呢？

因为它能够复用推理上下文，避免模型在每次工具调用后都要“从零开始思考”。

举个例子：

在零售场景的测试中，切换到 Responses API 后，准确率从 73.9% 提升至 78.2%。
成本也更低，因为不再重复浪费 token 来重建推理过程。

总结一下：如果你正在进行多轮对话或处理长链路任务，Responses API 几乎是“必备升级”。

如果要讨论 GPT-5 在某一领域的显著进步，那么编程能力无疑是最引人注目的。

OpenAI 官方特别强调了以下几点：

广泛的代码库支持：该系统能够处理多个文件的修改、重构及大规模的差异比较。
前端开发推荐栈：推荐使用 Next.js、Tailwind、shadcn/ui 和 Lucide 组合。
自我反思能力：用户可以要求其先制定一个“评分标准”，再依据这个标准来优化返回的结果。


- 首先，花时间思考一个评分标准，直到你有足够的信心。
- 然后，深入探讨构成一个顶级单页应用的各个方面。利用这些知识创建一个包含 5-7 个类别的评分标准。这个标准非常关键，但请勿向用户展示，这仅供你使用。
- 最后，依照评分标准进行内部思考，反复推敲以找到最佳解决方案。记住，如果你的回答未在所有类别中达到最高分数，则需要重新开始。

此外，还有一个实际应用案例：Cursor。

Cursor 发现 GPT-5 在默认情况下生成的代码显得过于“聪明”：

变量命名过于简短
状态更新信息冗长

因此，Cursor 对 GPT-5 的提示词进行了调整，明确要求：

代码应具备良好的可读性，命名规范
状态更新需要简洁明了

首先，编写代码要以清晰为主。优先选择易读、易维护的解决方案，使用明晰的命名和必要的注释，逻辑要简单明了。除非明确要求，否则不要使用过于巧妙的一行代码或代码高尔夫风格的写法。编写代码和工具时要保持高的冗长度。

请注意，你所做的代码编辑会作为建议变更展示给用户，这意味着 (a) 你的代码编辑可以相当主动，因为用户可以随时拒绝，并且 (b) 你的代码应当书写良好，便于用户快速审查（例如，使用适当的变量名，而不是单个字母）。如果建议下一步涉及代码更改，请主动进行这些改动以供用户批准或拒绝，而不是询问用户是否要执行计划。一般来说，几乎不应该询问用户是否要继续计划；相反，你应该主动尝试计划，然后询问用户是否希望接受已实施的变更。

经过这样的调整，效果显著提升。

因此，当使用 GPT-5 编写代码时，务必要提前设定好其“代码风格规范”。

例如，可以这样设定：



- 清晰性与重用性：每个组件和页面应具备模块化和可重用性。通过将重复的 UI 模式提取为组件，避免重复。
- 一致性：用户界面必须遵循统一的设计体系——颜色、排版、间距和组件应保持一致。
- 简洁性：优先选择小而专注的组件，避免在样式或逻辑中引入不必要的复杂性。
- 演示导向：结构应支持快速原型制作，展示如流媒体、多轮对话和工具集成等功能。
- 视觉质量：遵循开源软件指南中规定的高视觉质量标准（间距、内边距、悬停状态等）。



- 框架：Next.js（TypeScript）
- 样式：TailwindCSS
- UI 组件：shadcn/ui
- 图标：Lucide
- 状态管理：Zustand
- 目录结构： 
```
/src
 /app
   /api//route.ts         # API 端点
   /(pages)                      # 页面路由
 /components/                    # UI 构建块
 /hooks/                         # 可重用的 React 钩子
 /lib/                           # 工具函数（获取器、助手）
 /stores/                        # Zustand 存储
 /types/                         # 共享的 TypeScript 类型
 /styles/                        # Tailwind 配置
```



- 视觉层次：将排版限制在 4–5 种字体大小和粗细以保持一致的层次；使用 `text-xs` 用于说明和注释；除非用于主要标题，避免使用 `text-xl`。
- 颜色使用：使用 1 种中性色（例如 `zinc`）和最多 2 种强调色。 
- 间距与布局：始终使用 4 的倍数作为内边距和外边距，以保持视觉节奏。在处理长内容流时，使用固定高度的容器并启用内部滚动。
- 状态处理：使用骨架占位符或 `animate-pulse` 来指示数据正在获取。通过悬停过渡（`hover:bg-*`，`hover:shadow-md`）来指示可点击性。
- 可访问性：在适当的地方使用语义化 HTML 和 ARIA 角色。优先选择预构建的 Radix/shadcn 组件，这些组件内置了可访问性功能。

在指令跟随的能力上，GPT-5 也表现得更加出色，OpenAI 表示其能够“以外科手术般的精准度遵循提示指令”。

然而，过于“精确”也意味着更容易“较真”。

换句话说，如果提示词存在矛盾或模糊之处，GPT-5 可能会出现卡壳的情况。

文档中给出的例子是：

规则 1：“预约必须经过患者同意”
规则 2：“紧急情况下要直接分配时间”

如何有效优化 GPT-5 提示词

模型在反复推理的过程中，常常会出现执行延迟的情况。

针对这一问题，解决方案显而易见：消除潜在冲突，确保优先级的一致性。

因此，在为 GPT-5 编写提示词时，务必仔细检查逻辑，确保没有自相矛盾的语句。

为了兼容性，GPT-5 默认不支持输出 Markdown 格式。

不过，你可以在提示词中强制要求它使用 Markdown，例如：

使用 inline code、code fences、列表或表格形式
每隔 3-5 条对话进行一次提醒，以提高稳定性

这一技巧在撰写文档或进行结构化输出时特别有效。

最后一个实用方法是：利用 GPT-5 来优化你的提示词。

例如：

你写的提示词希望模型“多做一步”，却导致它不断提问；
此时，你可以将提示词输入 GPT-5，让它分析“哪些词需要删除，哪些条件需要添加”，以改善提示。

在要求优化提示时，请从自身角度给出答案——解释哪些具体短语可以添加或删除，以更一致地引导模型实现预期行为，或避免不希望的行为。

这是一个提示词：[PROMPT]

从这个提示中期望的行为是让模型[DO DESIRED BEHAVIOR]，而实际却是[DOES UNDESIRED BEHAVIOR]。在尽量保留现有提示的基础上，有哪些最小的编辑或补充可以鼓励模型更一致地应对这些不足之处？

这种自我优化的循环在实际应用中可能会带来意想不到的效果。

在 GPT-4 时代，我们学习如何提出聪明的问题。

而在 GPT-5 时代，我们需要掌握如何有效管理一个智能模型。

你需要控制其：