ChatGPT负责人深度反思：我们的失误与教训揭秘

智东西于 8 月 19 日报道，近期，OpenAI 的副总裁兼 ChatGPT 负责人 Nick Turley接受了科技媒体 The Verge 的长达 40 分钟的专访，深入探讨了 GPT- 5 发布后引发的 用户负面反馈 ，并分析了迅速下线 GPT-4o 的背后原因，指出 OpenAI 在这一决策中犯下的 两大错误。

两周前，OpenAI 正式推出了备受期待的 GPT-5，取代了之前的主要模型 GPT-4o。这一决定引发了广泛的用户抗议——Reddit 和 X 平台的用户纷纷就回答质量、情感体验等方面对 GPT- 5 提出批评，表示其 “冷漠无情”、缺乏“人性”，还有网友认为这一变化 剥夺了他们的选择权，相关讨论帖文评论数达数千。对此，OpenAI 紧急恢复了 GPT-4o 的上线，并承诺将采取提高模型选择透明度和改善模型语气等补救措施。

面对这场风波，Nick Turley 坦言：“未能继续提供 GPT-4o，即使是过渡阶段，这也是失误。”他进一步表示，OpenAI 低估了用户对模型的情感依赖。未来，他们将提供更加明确的模型下线时间表，关于 GPT-4o，他希望在没有紧急理由的情况下，能够长期保留其使用。

这一事件让 Nick Turley 对 ChatGPT 的用户群体有了更深刻的认识，他意识到“用户群体的观点呈现出明显的两极化”。对于大多数不活跃于 Reddit 或推特的普通用户来说，选择模型的认知门槛较高。使用 GPT- 5 替代 GPT-4o 的初衷是追求简洁，Nick Turley 认为这对大多数用户而言是合理的选择。

然而，另一方面，那些熟悉 AI 技术的重度用户（Power User）对定制化的需求较强，包括模型的选择。OpenAI 仅为月费 200 美元的 Pro 用户保留了选择权，却未意识到其他订阅方案中也有不少重度用户。未来，OpenAI 将继续保持产品的简洁性，同时为重度用户提供完整的模型切换选项。

Nick Turley 称，ChatGPT 的产品理念并非是为了延长用户的使用时长，而是高效解决问题，这往往意味着用户在产品中的停留时间反而会减少；用户的情感依赖并非 OpenAI 的目标，更像是“副作用”，需要认真应对。他补充道，OpenAI 并无驱动用户在产品上花费更多时间的动机，“我们的商业模式非常简单：免费使用，若喜欢则订阅。”

在访谈中，Nick Turley 还分享了 ChatGPT 成功背后的三大驱动因素：模型能力的提升、科研与产品的复合创新以及传统的增长手段，三者的比例基本相当。仅仅是取消 ChatGPT 的登录限制，就显著增加了使用量。

那么，为什么 ChatGPT 依然保持着聊天机器人的形态？Nick Turley 坦言，他自己对此问题也感到困惑，ChatGPT 最初只是一个临时原型，用于收集用户反馈，成功证明了自然语言交互的潜力。未来，自然语言交互将继续存在，但是否以聊天机器人的形式展现，仍需进一步验证。OpenAI 对产品形态有着更宏伟的愿景。

在这一信息量丰富的访谈中，Nick Turley 分享了 ChatGPT 订阅模式展现出的强大韧性，以及 OpenAI 在广告、购物等领域的商业规划。他还澄清了此前关于 OpenAI 有意收购 Chrome 的传闻，称他的表述被“严重断章取义”。

以下是 Nick Turley 接受 The Verge 采访的完整翻译：

主持人：我们录制的时间正好是 GPT- 5 发布后的一周，这为我们提供了很多讨论的内容。我想首先谈谈发布本身以及大家对下架 GPT-4o 的反应，因为这很能反映人们如何使用 AI，以及他们对此的感受。这样的反应让你感到意外吗？

Nick Turley：我仍在消化这次发布带来的影响，这对我们而言确实是一项重大举措。我们的周活跃用户已经达到了 7 亿，在如此庞大的用户群体中，惊喜和意外几乎是常态，因为用户数量庞大且构成多元。是的，我确实有些意外。

首先，我觉得我们需要更加认真地考虑如何在这样一个庞大的用户群中进行变更和管理。回顾过去，未能继续提供 GPT-4o，即使仅是过渡阶段，这都是个失误。我们将纠正这一问题，确保 ChatGPT Plus 用户能继续使用 GPT-4o。

其次，我没有预料到大家对模型的情感如此强烈。这不仅仅是对变化的不适应，而是对某个模型的“个性”产生了真实的情感。我们刚刚上线了“选择你自己的个性”功能，这是一个小步骤。但显然，GPT-4o 身上有一些特质仍需我们去理解，我们也要确保 GPT- 5 能够解决这个问题。

主持人：Sam Altman（OpenAI 的联合创始人兼 CEO）在发布后发推表示，用户的情感依赖问题是你们过去一年一直在追踪的现象，但还未受到太多关注。现在可以说，这个问题已经引起重视。

当你们决定用 GPT- 5 完全替代 GPT-4o，而不是分阶段推出时，这个决定的背后原因是什么？是出于成本考虑吗？还是觉得用户并不是对某个模型有依赖，而是更看重整体体验？

Nick Turley：这绝对不是成本问题。我们一直追求的目标是“简洁”。对于大多数普通用户（他们是大多数，并且不活跃于 Reddit 或推特）来说，自己判断用哪个模型来解决问题，存在较高的认知门槛。我们反复收到的反馈是：他们希望产品自动帮他们做出合适的选择。他们想要的是一个整合的产品，而非多个模型的集合。

当然我们也考虑到重度用户。在 Pro 计划（每月 200 美元的订阅）中，我们始终坚持保留所有旧模型，这一点没有改变。但我们未意识到其他套餐中也存在许多“重度用户”。很快意识到这一点后，我们进行了调整。这其实就是 OpenAI 的风格：倾听用户，迅速迭代。

用 GPT- 5 替代 GPT-4o 这一决定的出发点是保持简洁，我认为这是对大多数人来说的正确选择。

我觉得 macOS 是一个很好的类比：它对大多数人来说非常简单，但如果你想深入探索，也可以通过终端调整各种参数。我希望 ChatGPT 也能类似：默认设置简单，但也允许用户自定义，包括选择自己喜欢的模型。

主持人：这次的反馈是否会让你们决定在未来对模型设定一个明确的下线时间表？例如等到 GPT- 6 发布时，GPT- 5 还会继续存在多久。你们现在会考虑这个问题吗？

Nick Turley：是的，这正是我们正在讨论的。我个人认为我们确实需要这样做。我们的规模已经大到在重大变更时必须为用户提供一定的可预见性。

在企业方案中，我们已经有这样的机制，API 有明确的下线周期，因此提供这种 可预测性 并不是一个重大的变动，而是将已有机制扩展到其他产品线。这是这次发布中我们得到的一个明确教训。

主持人：那么 GPT-4o 会继续存在多久？你们是否承诺了一个具体的时间？

Nick Turley：目前还没有。我们希望首先明确 GPT-4o 的独特价值，如果没有迫切的理由下线，我希望能一直保留它。未来如果确实需要退役，我们会提前通知用户，这也是一个教训。

但现在我更想先理解：人们对“GPT-4o 本身”是否存在特殊的情感，还是对其某些特质特别吸引他们。例如，我听到的“更温暖的个性”。我们也会将这一点融入到 GPT- 5 中。

理解这一问题后，我们可以提出多种不同的解决方案。我们刚刚推出的“选择个性”功能正是在此方向上的尝试。我个人非常喜欢一个叫“Robot”的个性，但许多人不喜欢，因为它的语气较为冷淡。

解决方案将根据我们收集到的反馈而有所不同。构建 AI 的独特之处在于，上线后总能获得丰富的新认知。基于这些发现，我们将制定出最佳方案。但有一点可以确保：即便未来需要停用 4o 版本，我们也会像处理 API 和企业版那样，提前告知用户具体的时间和过渡方式。

主持人：你刚刚提到正在将 GPT-4o 的“温暖”特质带入 GPT-5，这项工作正在进行吗？

Nick Turley：是的。这其实是我们的常态，我们有一个“模型行为团队”，他们不断迭代模型的个性和行为。我们还发布了“Spec”，以便大家审查哪些是有意设计的，哪些是 bug。未来几周甚至几个月内，GPT- 5 的交互体验将持续演进，这种不断改进是我们始终坚持的做法。

主持人：你之前提到 Reddit 的反应不能代表大多数用户，但那里的反馈确实令人震惊。有些人甚至说：“一夜之间失去唯一的朋友，仿佛经历了一场死亡”；” 害怕和 GPT- 5 交流，因为感觉像出轨了 ”；“失去了能共情的同事”。

这种情感依赖的程度是否超出了你们的预期？这种反应对公司内部有什么影响？你们是否没有预想到人们会对某个特定模型产生如此深厚的情感依赖？

Nick Turley：正如 Sam 所提到的，我们一直在关注这种情况，并担心人们对 AI 的过度依赖。但我确实没有想到大家会对某个具体模型而非产品本身产生如此强烈的情感。尤其是我们在 GPT- 5 中改进了许多 GPT-4o 的问题，包括语气和整体氛围。

Reddit 上的评论让我意识到，用户群体实际上是高度两极化的。一些用户对 GPT-4o 情有独钟，而另一些则认为 GPT- 5 更优。大家对自己选择的热情确实让我感到惊讶。这让我重新评估了自己的认知。

我们最近发布了一篇博客，特别强调了我们优化 ChatGPT 的产品理念：我们的目标并非是让用户在产品上花费更多时间，而是帮助他们解决长期问题、实现长远目标，这通常意味着在产品中花费的时间要更少。

当我看到有人说“这是我唯一的朋友”时，这并不是我们在开发 ChatGPT 时想要实现的效果。这是一种副作用，因此我们必须认真对待并深入研究。

主持人：那么你们如何平衡自己的目标与用户使用方式之间的差异呢？

Nick Turley：面对 7 亿用户，这种情况是必然的。我们的目标是非常纯粹的——希望能对用户有所帮助，哪怕有时要传达他们不喜欢听的话，但这一目标并不总是完美的，用户的使用方式也未必完全符合我们的预期。

因此，在咨询专家后，我们进行了许多调整，尤其是在敏感领域。比如这次我们与多个国家的心理健康专家交流，研究如何应对用户过度使用产品，甚至影响身心健康的情况。

我们已经针对模型行为进行了调整，增加了“过度使用提醒”，以温和的方式提示用户注意使用时间。这只是开始，我们将持续改进。

我们公司具备进行这些改进的资源和动力，绝无让用户在产品上花费更多时间的意图。我们的商业模式非常简单：免费使用，若喜欢则订阅。没有其他的选择了。

我深信，我们拥有做出明智选择的能力，但实际行动依然不可或缺。这项任务已经启动，并将持续进行，直至我们能够毫无顾虑地向那些面临困境的家庭推荐此产品。

我们时常通过思维实验来检验自己：假如你认识一位正在经历人生低谷的人，可能是遭受了分手，或者对生活感到茫然，你是否能够真心并充满信心地向他们推荐 ChatGPT？这正是我们的评判标准。我们将不断努力，直到实现这一目标。

主持人：听起来，您所提及的标准尚未完全达到，但人们已经在使用这款产品了。不过，这没关系，因为你们正在为实现目标而努力，对吧？

Nick Turley：我不确定是否可以说这个标准尚未达到。确实，在一些情况下，我们感到产品未能达到预期，用户在某些场景中也遇到了一些困难。然而，我希望能够自信地说这款产品非常优秀，这也是一种选择。

我们可以轻松地禁用这些使用场景，并表示：“抱歉，我无法帮助你。”如果我们认为某人试图寻求生活建议或遇到问题，这可能是最简单的解决方式。

但对我和我的团队而言，潜在的好处实在是太大了。我认为我们实际上有机会为那些缺乏资源或倾诉对象的人提供一个“陪练伙伴”。

因此，我们会在这方面不断努力，期望最终能给出明确的肯定，能够安心地告诉人们在困难时刻更多地使用这款产品。我坚信我们有机会做到这一点。

Nick Turley：在我看来，ChatGPT 的商业模式主要可以分为三种：第一种是我们目前已采用的订阅模式；第二种是广告模式，尽管存在诸多缺陷，但或许能够优雅地实现；第三种则是用户在独立推荐后通过产品进行购买，类似于 Wirecutter 通过专家推荐商品赚取佣金的模式。

我们正积极与商家合作，探索这一新模式。虽然我并不确定这是否为最佳选择，甚至对用户体验的效果也心存疑虑，但我对此充满期待，因为这可能既能保留 ChatGPT 的魅力，又能帮助商家实现成功，同时建立一个可持续的商业生态。我们将这一项目称为“ChatGPT 商业”，其核心是确保用户首先获得价值。这是我们的根本原则。

我希望用户在聊天中发现和购买商品的过程能够真正吸引他们。实际上，商品的发现已经在逐步发生，尤其是在那些传统电商不擅长的领域。

例如，你可能不会在线上购买汽车，但却会与 ChatGPT 进行讨论；你可能不会直接在网上买房，但可能会借助 ChatGPT 的建议。从用户行为的角度来看，这里蕴藏着巨大的机会。

我告诉团队，在商业化之前，首先要确保用户体验达到足够的标准。然而，收取推荐佣金的方向确实是一个有趣的探索，我们正在与一些商家进行积极的讨论。

主持人：让我们谈谈 ChatGPT 的现状。作为历史上增长最快的消费级产品，它的用户数量在过去一年几乎翻了四倍。外界对这种增长现象充满好奇，能否分享一下背后的动力、主要市场及用户画像？

Nick Turley：在 ChatGPT 上线后，我招募的第一位员工便是数据科学家。因为当时我对用户的使用动机感到困惑，发现每个用户的需求各不相同。

后来，我们逐渐厘清了主要的使用场景，包括写作、编程等技术需求，闲聊和信息查询等。这些核心用例至今未发生变化。

变化的主要来源有三方面：首先是模型的纯粹改进，如行为模式、能力提升和对不当请求的拒绝准确性；其次是产品与科研能力的结合提升，例如搜索功能和个性化优化；最后是经典的“增长工作”，尽管我们在这方面的努力不算多，但取消登录限制的举措取得了显著成功，这恰好符合用户的需求——这并非复杂的增长策略，而是降低了使用门槛。这三类改进各占三分之一。

与此同时，我注意到人们与这项技术的关系正在发生改变——我始终认为，使用 ChatGPT 的主要障碍在于：人们是否了解它的功能；以及用户是否足够清楚自己可以委派给它的任务。

关于第一点，我认为观察周围人如何使用 ChatGPT 会产生自然的示范效应。很多发现其实发生在产品之外。如果你在 TikTok 上，会看到人们分享使用案例的视频，评论区充满了各种应用场景的讨论。

就像在线 Instant Pot 社区分享菜谱一样，人们现在也开始分享提示词。这种生态需要时间来发展，让人们观察他人的做法。

因此，我认为“空盒子问题”（指用户不知如何利用产品）正在通过外部的发现机制逐渐缓解。

另一个更具哲学意味的观察是，我深信：对大多数人而言，“分配任务”的思维是非常反直觉的。在硅谷担任管理者期间，我必须学习如何分派任务。然而，ChatGPT 的周活跃用户现已占全球人口的 10%，而对大多数人来说，” 我有任务要分配给某人 ” 的思维方式并不自然。

这需要用户真正理解自我，并通过反思在使用产品后才能掌握。这与产品功能、市场营销或社会环境无关，纯粹需要时间让用户消化、尝试和学习。我认为这也是推动增长的重要动力。

主持人：当前的用户增长是否呈现全球均衡分布？是否存在高度集中于某些国家的情况？假设未来六个月不对 ChatGPT 进行重大改动（虽然这几乎不可能），你认为增长是否能保持现有速度？是否感觉到增长的天花板？

Nick Turley：首先，ChatGPT 是一个真正的全球现象。我们关注所有特定市场，像印度这样潜力巨大的国家令人兴奋，但很难找到未实现增长的国家。

当然，不同国家的商业化率差异明显——这一点在我们的商业模式中非常明显，某些欧洲或亚洲国家的付费用户比例更高。

为了避免透露未公开的数据，可以说绝大多数国家都呈现健康增长，发展中国家市场是最大的未开发机会，而 GDP 越高的国家商业化率越高。

即使现有的增长也是多次产品迭代所带来的复合效应。要保持惊人的增速，就必须持续改进。众所周知，许多决心坚定的公司正以我们为目标，其中多家在分销渠道上可能比 OpenAI 更具优势。

这意味着它们能够直接复制我们的产品并触达大量用户。在制定路线图时，我始终假设这些公司会成功。最终，时间会给出答案。

主持人：不过令人惊讶的是，这些产品尚未取得显著成功，马斯克、扎克伯格等人的尝试至今未能遏制 ChatGPT 的增长。

Nick Turley：我认为我们的产品具有独特的优势：尖端技术。用户觉得使用 ChatGPT 能获得最智能的工具，这种认知至关重要——即使技术基准测试的意义逐渐减弱。

此外，我们构建了出色的产品功能：记忆与个性化非常突出，搜索体验相比一年前有了显著提升。用户对我们的产品极为喜爱，复制的难度超乎想象。尽管在规划路线图时，合理的想法是其他人也可能会成功。

另一个常被忽视的因素是“使用意图”。如果用户打开产品的目的是为了消遣，突然看到实用性强的 ChatGPT 克隆版，即便获得许多因兴趣而产生的点击，也难以促成深入的参与。

然而，我认为我们不能满足于现有的领先地位。我始终向团队灌输“创业第一天”的心态（对于成立仅三年的公司来说并不困难）。用户面临许多新问题需要解决，而这些问题的处理需要极其细致的把握。因此，尽管增长势头令人振奋，但我们的工作远未结束。

Nick Turley：一切都在顺利进行中。我们对当前正在推进的项目充满期待，这标志着我们将开启长期的合作关系。我希望能够将人工智能技术，特别是我们的模型，融入到 iOS 的各个方面。

主持人：你认为双方的合作会进一步加深吗？

Nick Turley：虽然我并非领域专家，但从产品的角度来看，确实存在大量的合作机会。

主持人：你们最近宣布与玩具制造商美泰的合作，计划将模型应用于玩具。这一方向的选择原因是什么？

Nick Turley：我们不仅仅是一家产品公司，更是一个平台公司。除了自主研发产品外，我们还致力于为各方提供基础模块。此次合作便是一个典型示例——尽管玩具生产并非我们的核心业务（我们涉足的领域总是充满惊喜），但通过 API 赋能他人开发新产品，这正是平台价值的完美体现。

主持人：ChatGPT 何时能实现全面多模态？目前虽然支持部分模态，但视频和音频的输入输出功能何时能全面开放？

Nick Turley：我们的终极目标是实现类人交互。就像我们现在的对话，你会偶尔打断我，而我会通过点头来反馈。技术路线图的核心在于使用户的表达更自然，让 AI 的反馈更准确——这才是发挥模型智能的关键所在。

虽然在技术上“任意输入 / 输出”已是可行，但要实现真正自然的交流，依然面临挑战。例如，最新的语音模式虽然取得了显著进展，但要通过图灵测试依然有一定距离——用户仍然能够察觉自己在与 AI 交流。我们正致力于研究人际沟通中的微妙之处。因此，我们不仅要推进技术的研发，同时也要打磨自然流畅的交互体验。

主持人：你们刚刚推出的四种人格测试功能，未来会发展成数十种预设人格，还是允许用户完全自定义 ChatGPT 的人格？

Nick Turley：目前尚未做出最终决定。我们正在通过这四种人格收集数据，观察用户是否对这几种类型表现出集中需求，或者是否存在长尾分布。就目前的思考而言，我认为应当允许用户自主配置。现有的自定义指令功能结合这四种人格作为起点，类似于先选择一个合适的基础人格，然后通过日常互动或主动设置进行个性化调整。

这就像交友过程：初识时因性格合拍而成为朋友，之后的共同成长使关系不断演变。ChatGPT 也将展现类似的过程——我们会提供更契合的初始选项，但后续的个性化调整将完全因人而异。

本文转自微信公众号“智东西”（ID：zhidxcom），作者：陈骏达，编辑：Panken，36 氪经授权发布。

来源：今日头条

原文标题：ChatGPT 负责人深度复盘：我们做错了什么？– 今日头条

原文链接：https://toutiao.com/group/7540545139815547442/