实测GPT-5.2：价格飙升背后的实力，如何挑战Gemini！

共计 4938 个字符，预计需要花费 13 分钟才能阅读完成。

今晨，GPT 5.2 正式发布，旨在超越 Gemini，向所有用户开放。

上个月我刚取消了 ChatGPT Plus 的订阅，转而使用 Gemini，这次是否需要重新考虑回到 GPT-5.2 呢？

通过查看以下网友的真实反馈，以及 APPSO 的实测，或许能帮助我们找到答案。

这次终于没有搞错时间

GPT 5.2 更新了三种模型，分别为 GPT-5.2 Instant、Thinking 和 Pro模型。如果你已经习惯了 Gemini 3.0 Pro 的问答思路，使用 GPT-5.2 Thinking/Pro 时，可能会察觉到思考速度有所减缓，所需时间比以前更长。

很多提前体验的用户在社交平台上分享了这样的感受：与 5.1 版本相比，GPT-5.2 在各个方面均有所提升，而 GPT-5.2 Pro 则特别适合进行复杂的推理工作，但等待结果的时间却显得更为漫长。

例如，有用户反馈，他们请求生成一张 HLE 测试成绩图表，结果 GPT-5.2 Pro 花费了整整 24 分钟才完成。

图片来源：
https://x.com/emollick/status/1999185755617300796/photo/1

不过，所有生成的信息依旧精准，即使图表中最优的结果仍然是来自于 Gemini 3.0 Pro。

这得益于 GPT-5.2 的知识更新至 2025 年 8 月，相比之下，GPT-5.1 的知识截至日期为 2024 年 9 月，而上个月发布的 Gemini 3.0 则截止于 2025.1。

在使用 GPT-5.2 Thinking 时，当我们请求生成 OpenAI 模型发布历史的图表时，所需时间并不长，且信息相对准确。对于简单的任务，Thinking 模型和 Pro 模型之间的时间差异显著。

GPT-5.2：新一代模型在3D建模领域的崭露头角

凭借其卓越的推理能力和广泛的知识背景，GPT-5.2 在多模态图像理解与推理方面表现出色，迅速在大型模型竞争中跻身第二名。在网页开发领域，GPT-5.2-High 荣登第二位，而其兄弟版本GPT-5.2则位列第六。相比之下，Gemini 3.0 Pro排名第三，依然由Claude保持首位。

LMArena 官方发布了一段实测视频，展示了GPT-5.2在完成一系列3D建模任务中的出色表现，完成度令人印象深刻。然而，仍有网友在评论区质疑道：“难道我们还停留在2003年吗？”

视频来源：
https://x.com/arena/status/1999189215603753445

使用three.js实现的3D效果，充分展现了模型在理解和推理上的多模态能力，同时也在编程开发与设计方面进行了优化。GPT-5.2的0.1版本升级无疑是值得的。

目前，许多网友分享了测试结果，重点集中在构建完整的3D引擎上，GPT-5.2的表现亦颇为亮眼。例如，使用GPT-5.2 Thinking模式进行高难度推理，成功在单页中构建了一个支持互动控制、能够导出4K分辨率的3D雪天冰块王国模型。

链接

此外，还有网友利用GPT-5.2 Pro创建了3D波涛汹涌的哥特城市建筑。

提示词：创建一个视觉上引人入胜的着色器，可以在twigl-dot-app中运行，呈现出部分淹没在暴风海洋中的无限新哥特塔楼城市。来源：
https://x.com/emollick/status/1999185085719887978?s=20

探索3D艺术与模拟：从图像生成到森林火灾模拟

在3D理解和推理能力的研究中，我们借鉴了Ian Goodfellow在Gemini 3.0 Pro发布后使用的提示，具体做法是上传一张图片，并要求模型基于该图像创建一个精美的体素艺术场景，该场景采用Three.js单页应用程序实现。

由于ChatGPT未能在画布上生成预期结果，我选择将其在对话框中生成的代码复制到HTML视图中，通过右侧图像呈现效果。

这种差异显而易见，虽然ChatGPT成功提取了上传图像的信息，包括一棵粉红书、一片绿色草地以及灰色的沉陷地带和白色的水流，然而它生成的3D动画相比Gemini 3.0 Pro显得较为粗糙。

我只能说，奥特曼发出的「红色警报」清楚地表明了Gemini的实力。

在编程能力测试中，经典的六边形小球物理运动是不可或缺的。有博主为小球运动增加了难度，全部采用闪烁的红色3D小球，效果相当吸引人，许多网友纷纷询问实现的方式；然而也有网友提出，这些小球似乎并未受到重力的影响。

随后，有网友解释称，这实际上是在模拟太空环境。

视频来源：
https://x.com/flavioAd/status/1999183432203567339

此外，还有SVG代码测试，展示了骑自行车的鹈鹕。

图片

还有网友分享了他们用GPT-5.2制作的森林火灾模拟器，能够调整火灾的速度、范围及燃烧面积等参数。

图片来源：
https://x.com/1littlecoder/status/1999191170581434557?s=20

我们还构建了一个星球信号网页，与森林火灾可视化的网页布局相似，左侧显示的内容中，星星的图案被替换为太空中的星球。

探索AI编程新境界：从拍立得到交通灯模拟

当我们构建一个星球信号网页时，它的设计灵感来源于森林火灾可视化界面。左侧的内容区域中，原本的星星图案被替换为太空中的星球，营造出一种全新的视觉效果。

我们还利用之前的Gemini 3进行了一次有趣的实验，输入了相同的提示，要求它创建一款复古风格的拍立得网页相机应用。

实测 GPT-5.2：价格飙升背后的实力，如何挑战 Gemini！

我们希望开发一款复古风格的单页相机应用，页面的背景设计为软木板或深色木纹。左下角固定一个用CSS或SVG绘制的拟物化拍立得相机模型，镜头区域实时显示用户的摄像头画面。用户点击快门按钮时，会播放快门音效，并缓慢吐出一张带白色边框的相纸。通过CSS滤镜，滑出的照片起初是高模糊和黑白的状态，5秒内平滑过渡到清晰的全彩效果。显影后的照片可自由拖拽，随机添加旋转角度和阴影，点击照片后可将其置顶，形成一个生动的拼贴墙。

令人惊喜的是，ChatGPT也能够一次性实现拍立得的设计。

在我们之前测试Gemini 3.0 Pro时，发现其强大的编程能力让人印象深刻。我们只需输入一个截屏或视频，Gemini便能轻松复刻出相应的效果。

这一次，我们同样给它提供了一个视频，要求复刻一个古诗词生成的网页。

实测 GPT-5.2：价格飙升背后的实力，如何挑战 Gemini！

https://chatgpt.com/canvas/shared/693b6d1b8fa881919c6298a4aed05581

相比于之前的GPT-5.1，它对上传视频的配色方案有了更好的理解。尽管Gemini能够直接将AI功能集成到生成的网页中，而ChatGPT还未将AI融入这些网页，因此生成的诗歌依旧局限于已经写好的几首。

除了测试编程能力和创建单页HTML文件，还有网友利用它编写Python代码。

其中一位网友的提示是“编写一个Python代码，模拟单行道交通灯的工作原理，并可视化随机速率进入的车辆”。

他同时测试了GPT 5.2 Extended Thinking和Claude Opus 4.5，结果显而易见。我们经常被问到哪个编程模型最好，Claude之所以受到开发者青睐，绝非偶然。

标题：GPT-5.2与Claude Opus 4.5的比较：新一代模型的崛起

最近，GPT-5.2的发布引起了广泛关注。根据官方信息，该模型在图像处理能力上有了显著的提升，尤其是在图表推理和软件界面理解的准确性方面，错误率降低了近一半。

值得注意的是，Claude Opus 4.5的定价也相对较高，其输入费用为每百万Token 5美元，而输出则高达25美元。与之相比，GPT-5.2的价格也有所上涨，整体上涨幅度约为40%。具体而言，GPT-5.2 Pro的输入费用为21美元，输出费用则为168美元。

在OpenAI的官方发布博客中，关于GPT-5.2的能力提升有详细说明。特别是在处理模糊图像时，GPT-5.2能够标注更多相关区域，尽管它仍会出现错误。这与前一版本GPT-5.1相比，标注精度有所提高。

在用户体验方面，有网友将Nano Banana Pro与GPT-5.2进行对比，去掉了图像上的标注信息后，重新要求其进行目标定位。这个实验引发了热议，大家不禁思考哪种模型在图像处理领域的表现更为出色。

从不同模型的表现来看，虽然GPT-5.2在编程和图像处理上有了不小的进步，但与Nano Banana Pro相比，仍然存在某些不足之处。许多用户反映，尽管ChatGPT的使用体验有所提升，但在与其他模型的比较中，尚未达到显著领先的地步。

此外，一些网友分享了使用GPT-5.2进行网页设计的案例，引发了对前端开发者未来工作的讨论。大家开始关注，随着这些新模型的推出，前端程序员是否会面临更大的挑战。

总之，GPT-5.2在各个方面的改进值得关注，但在图像处理和编程领域仍需努力，以在竞争中占据有利位置。

标题：GPT-5.2的设计与写作能力：进步与挑战并存

与之前普遍使用的渐变紫色相比，GPT-5.2 的设计水平显著提升。然而，如博主所述，GPT-5.2似乎特别倾向于在界面中使用方框，导致多处出现叠加的网格状元素。

在设计能力的评比中，GPT-5.2 取得了显著进展，从之前的十名开外跃升至第三名，尽管得分最高的仍是 Gemini 3.0 Pro。

图片来源：
https://www.designarena.ai/leaderboard

我们也对GPT-5.2提出了一些要求，希望其为一家人工智能公司设计一个“高端”的首页。结果显示，GPT-5.2 确实偏爱使用方框，而渐变紫色又一次出现在设计中。

提示词：您是全球顶尖的设计师和开发者，负责前沿设计和开发的创新。您需要使用 {WebGL + ThreeJs} 创建一个完整的着陆页，风格参考上传的图片，专为一家 AI 公司设计。请专注于设计部分，而非开发。导入所有必要的文件和库：Three.js、WebGL、GSAP，以及与 3D 开发相关的其他动画库。

最后，关于写作方面，部分用户在体验后反映，GPT-5.2 开始具备了创作长篇小说的能力。

例如，当 ChatGPT 被请求生成 50 个情节创意时，它能够全部完成，而非像其他模型那样仅输出部分内容。当被要求撰写一本 200 页的书时，ChatGPT 并没有直接拒绝，而是积极尝试，构建了整本书的框架，并生成了 PDF 文件。

网友们指出，尽管书页的质量较为薄弱，篇幅较短……毕竟，它目前还无法一口气写出一本可出版的小说，但其能开始尝试，提供 50 个创意并写出 200 页书，确实展示了其思维深度。

GPT-5.2 最为突出的一点在于它能够有效地执行指令……这不仅仅是简单地按照要求完成，更是全面实现用户所描述的任务。

现在，GPT-5.2 应该已经逐步推送给所有用户，你的使用体验如何呢？

尽管GPT-5.2的升级在某些方面令人印象深刻，但我仍然没有从Gemini转向它。虽然它在多个榜单上取得了不俗的成绩，但在实际应用中，生成的3D程序常常出现错误，而整体审美风格也未能实现显著突破，价格也仍然偏高。

Gemini持续施压奥特曼，引发新一轮竞争

网友锐评

Gemini并没有停下脚步，仍在不断对奥特曼施加压力。尽管今天凌晨并未推出全新模型，但对Gemini Deep Research进行了重新设计，并且现在可以通过API进行访问。未来，Gemini将与Google搜索和NotebookLM进行升级整合。

实测 GPT-5.2：价格飙升背后的实力，如何挑战 Gemini！

新推出的Gemini深度研究Agent在“人类最后的考试”（HLE）中以46.4%的成绩战胜了刚发布的GPT-5.2 Thinking（45.5%）。此外，它在Google推出的DeepSearchQA和BrowseComp测试中也取得了优异的表现。

看来，奥特曼的红色警报还将持续一段时间。