实测GPT-5.2:价格飙升背后的实力,如何挑战Gemini!

共计 4938 个字符,预计需要花费 13 分钟才能阅读完成。

今晨,GPT 5.2 正式发布,旨在超越 Gemini,向所有用户开放。

上个月我刚取消了 ChatGPT Plus 的订阅,转而使用 Gemini,这次是否需要重新考虑回到 GPT-5.2 呢?

通过查看以下网友的真实反馈,以及 APPSO 的实测,或许能帮助我们找到答案。

这次终于没有搞错时间

GPT 5.2 更新了三种模型,分别为 GPT-5.2 Instant、Thinking 和 Pro模型。如果你已经习惯了 Gemini 3.0 Pro 的问答思路,使用 GPT-5.2 Thinking/Pro 时,可能会察觉到思考速度有所减缓,所需时间比以前更长。

很多提前体验的用户在社交平台上分享了这样的感受:与 5.1 版本相比,GPT-5.2 在各个方面均有所提升,而 GPT-5.2 Pro 则特别适合进行复杂的推理工作,但等待结果的时间却显得更为漫长。

例如,有用户反馈,他们请求生成一张 HLE 测试成绩图表,结果 GPT-5.2 Pro 花费了整整 24 分钟才完成。

图片来源:
https://x.com/emollick/status/1999185755617300796/photo/1

不过,所有生成的信息依旧精准,即使图表中最优的结果仍然是来自于 Gemini 3.0 Pro。

这得益于 GPT-5.2 的知识更新至 2025 年 8 月,相比之下,GPT-5.1 的知识截至日期为 2024 年 9 月,而上个月发布的 Gemini 3.0 则截止于 2025.1。

在使用 GPT-5.2 Thinking 时,当我们请求生成 OpenAI 模型发布历史的图表时,所需时间并不长,且信息相对准确。对于简单的任务,Thinking 模型和 Pro 模型之间的时间差异显著。

GPT-5.2:新一代模型在3D建模领域的崭露头角

凭借其卓越的推理能力和广泛的知识背景,GPT-5.2 在多模态图像理解与推理方面表现出色,迅速在大型模型竞争中跻身第二名。在网页开发领域,GPT-5.2-High 荣登第二位,而其兄弟版本GPT-5.2则位列第六。相比之下,Gemini 3.0 Pro排名第三,依然由Claude保持首位。

LMArena 官方发布了一段实测视频,展示了GPT-5.2在完成一系列3D建模任务中的出色表现,完成度令人印象深刻。然而,仍有网友在评论区质疑道:“难道我们还停留在2003年吗?”

视频来源:
https://x.com/arena/status/1999189215603753445

使用three.js实现的3D效果,充分展现了模型在理解和推理上的多模态能力,同时也在编程开发与设计方面进行了优化。GPT-5.2的0.1版本升级无疑是值得的。

目前,许多网友分享了测试结果,重点集中在构建完整的3D引擎上,GPT-5.2的表现亦颇为亮眼。例如,使用GPT-5.2 Thinking模式进行高难度推理,成功在单页中构建了一个支持互动控制、能够导出4K分辨率的3D雪天冰块王国模型。

链接

此外,还有网友利用GPT-5.2 Pro创建了3D波涛汹涌的哥特城市建筑。

提示词:创建一个视觉上引人入胜的着色器,可以在twigl-dot-app中运行,呈现出部分淹没在暴风海洋中的无限新哥特塔楼城市。来源:
https://x.com/emollick/status/1999185085719887978?s=20

探索3D艺术与模拟:从图像生成到森林火灾模拟

在3D理解和推理能力的研究中,我们借鉴了Ian Goodfellow在Gemini 3.0 Pro发布后使用的提示,具体做法是上传一张图片,并要求模型基于该图像创建一个精美的体素艺术场景,该场景采用Three.js单页应用程序实现。

由于ChatGPT未能在画布上生成预期结果,我选择将其在对话框中生成的代码复制到HTML视图中,通过右侧图像呈现效果。

这种差异显而易见,虽然ChatGPT成功提取了上传图像的信息,包括一棵粉红书、一片绿色草地以及灰色的沉陷地带和白色的水流,然而它生成的3D动画相比Gemini 3.0 Pro显得较为粗糙。

我只能说,奥特曼发出的「红色警报」清楚地表明了Gemini的实力。

在编程能力测试中,经典的六边形小球物理运动是不可或缺的。有博主为小球运动增加了难度,全部采用闪烁的红色3D小球,效果相当吸引人,许多网友纷纷询问实现的方式;然而也有网友提出,这些小球似乎并未受到重力的影响。

随后,有网友解释称,这实际上是在模拟太空环境。

视频来源:
https://x.com/flavioAd/status/1999183432203567339

此外,还有SVG代码测试,展示了骑自行车的鹈鹕。

图片

还有网友分享了他们用GPT-5.2制作的森林火灾模拟器,能够调整火灾的速度、范围及燃烧面积等参数。

图片来源:
https://x.com/1littlecoder/status/1999191170581434557?s=20

我们还构建了一个星球信号网页,与森林火灾可视化的网页布局相似,左侧显示的内容中,星星的图案被替换为太空中的星球。

探索AI编程新境界:从拍立得到交通灯模拟

当我们构建一个星球信号网页时,它的设计灵感来源于森林火灾可视化界面。左侧的内容区域中,原本的星星图案被替换为太空中的星球,营造出一种全新的视觉效果。

我们还利用之前的Gemini 3进行了一次有趣的实验,输入了相同的提示,要求它创建一款复古风格的拍立得网页相机应用。

实测 GPT-5.2:价格飙升背后的实力,如何挑战 Gemini!

我们希望开发一款复古风格的单页相机应用,页面的背景设计为软木板或深色木纹。左下角固定一个用CSS或SVG绘制的拟物化拍立得相机模型,镜头区域实时显示用户的摄像头画面。用户点击快门按钮时,会播放快门音效,并缓慢吐出一张带白色边框的相纸。通过CSS滤镜,滑出的照片起初是高模糊和黑白的状态,5秒内平滑过渡到清晰的全彩效果。显影后的照片可自由拖拽,随机添加旋转角度和阴影,点击照片后可将其置顶,形成一个生动的拼贴墙。

令人惊喜的是,ChatGPT也能够一次性实现拍立得的设计。

在我们之前测试Gemini 3.0 Pro时,发现其强大的编程能力让人印象深刻。我们只需输入一个截屏或视频,Gemini便能轻松复刻出相应的效果。

这一次,我们同样给它提供了一个视频,要求复刻一个古诗词生成的网页。

实测 GPT-5.2:价格飙升背后的实力,如何挑战 Gemini!

https://chatgpt.com/canvas/shared/693b6d1b8fa881919c6298a4aed05581

相比于之前的GPT-5.1,它对上传视频的配色方案有了更好的理解。尽管Gemini能够直接将AI功能集成到生成的网页中,而ChatGPT还未将AI融入这些网页,因此生成的诗歌依旧局限于已经写好的几首。

除了测试编程能力和创建单页HTML文件,还有网友利用它编写Python代码。

其中一位网友的提示是“编写一个Python代码,模拟单行道交通灯的工作原理,并可视化随机速率进入的车辆”。

他同时测试了GPT 5.2 Extended Thinking和Claude Opus 4.5,结果显而易见。我们经常被问到哪个编程模型最好,Claude之所以受到开发者青睐,绝非偶然。

标题:GPT-5.2与Claude Opus 4.5的比较:新一代模型的崛起

最近,GPT-5.2的发布引起了广泛关注。根据官方信息,该模型在图像处理能力上有了显著的提升,尤其是在图表推理和软件界面理解的准确性方面,错误率降低了近一半。

值得注意的是,Claude Opus 4.5的定价也相对较高,其输入费用为每百万Token 5美元,而输出则高达25美元。与之相比,GPT-5.2的价格也有所上涨,整体上涨幅度约为40%。具体而言,GPT-5.2 Pro的输入费用为21美元,输出费用则为168美元。

在OpenAI的官方发布博客中,关于GPT-5.2的能力提升有详细说明。特别是在处理模糊图像时,GPT-5.2能够标注更多相关区域,尽管它仍会出现错误。这与前一版本GPT-5.1相比,标注精度有所提高。

在用户体验方面,有网友将Nano Banana Pro与GPT-5.2进行对比,去掉了图像上的标注信息后,重新要求其进行目标定位。这个实验引发了热议,大家不禁思考哪种模型在图像处理领域的表现更为出色。

从不同模型的表现来看,虽然GPT-5.2在编程和图像处理上有了不小的进步,但与Nano Banana Pro相比,仍然存在某些不足之处。许多用户反映,尽管ChatGPT的使用体验有所提升,但在与其他模型的比较中,尚未达到显著领先的地步。

此外,一些网友分享了使用GPT-5.2进行网页设计的案例,引发了对前端开发者未来工作的讨论。大家开始关注,随着这些新模型的推出,前端程序员是否会面临更大的挑战。

总之,GPT-5.2在各个方面的改进值得关注,但在图像处理和编程领域仍需努力,以在竞争中占据有利位置。

标题:GPT-5.2的设计与写作能力:进步与挑战并存

与之前普遍使用的渐变紫色相比,GPT-5.2 的设计水平显著提升。然而,如博主所述,GPT-5.2似乎特别倾向于在界面中使用方框,导致多处出现叠加的网格状元素。

在设计能力的评比中,GPT-5.2 取得了显著进展,从之前的十名开外跃升至第三名,尽管得分最高的仍是 Gemini 3.0 Pro。

图片来源:
https://www.designarena.ai/leaderboard

我们也对GPT-5.2提出了一些要求,希望其为一家人工智能公司设计一个“高端”的首页。结果显示,GPT-5.2 确实偏爱使用方框,而渐变紫色又一次出现在设计中。

提示词:您是全球顶尖的设计师和开发者,负责前沿设计和开发的创新。您需要使用 {WebGL + ThreeJs} 创建一个完整的着陆页,风格参考上传的图片,专为一家 AI 公司设计。请专注于设计部分,而非开发。导入所有必要的文件和库:Three.js、WebGL、GSAP,以及与 3D 开发相关的其他动画库。

最后,关于写作方面,部分用户在体验后反映,GPT-5.2 开始具备了创作长篇小说的能力。

例如,当 ChatGPT 被请求生成 50 个情节创意时,它能够全部完成,而非像其他模型那样仅输出部分内容。当被要求撰写一本 200 页的书时,ChatGPT 并没有直接拒绝,而是积极尝试,构建了整本书的框架,并生成了 PDF 文件。

网友们指出,尽管书页的质量较为薄弱,篇幅较短……毕竟,它目前还无法一口气写出一本可出版的小说,但其能开始尝试,提供 50 个创意并写出 200 页书,确实展示了其思维深度。

GPT-5.2 最为突出的一点在于它能够有效地执行指令……这不仅仅是简单地按照要求完成,更是全面实现用户所描述的任务。

现在,GPT-5.2 应该已经逐步推送给所有用户,你的使用体验如何呢?

尽管GPT-5.2的升级在某些方面令人印象深刻,但我仍然没有从Gemini转向它。虽然它在多个榜单上取得了不俗的成绩,但在实际应用中,生成的3D程序常常出现错误,而整体审美风格也未能实现显著突破,价格也仍然偏高。

Gemini持续施压奥特曼,引发新一轮竞争

网友锐评

Gemini并没有停下脚步,仍在不断对奥特曼施加压力。尽管今天凌晨并未推出全新模型,但对Gemini Deep Research进行了重新设计,并且现在可以通过API进行访问。未来,Gemini将与Google搜索和NotebookLM进行升级整合。

实测 GPT-5.2:价格飙升背后的实力,如何挑战 Gemini!

新推出的Gemini深度研究Agent在“人类最后的考试”(HLE)中以46.4%的成绩战胜了刚发布的GPT-5.2 Thinking(45.5%)。此外,它在Google推出的DeepSearchQA和BrowseComp测试中也取得了优异的表现。

看来,奥特曼的红色警报还将持续一段时间。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),我们将第一时间为您送上更多精彩内容。

爱范儿|原文链接· ·新浪微博

来源:今日头条
原文标题:实测 GPT-5.2 :价格暴涨能力微涨,凭什么反击 Gemini – 今日头条
声明:
文章来自网络收集后经过ai改写发布,如不小心侵犯了您的权益,请联系本站删除,给您带来困扰,深表歉意!
正文完
 0
小智
版权声明:本站原创文章,由 小智 于2026-01-17发表,共计4938字。
转载说明:除特殊说明外本站文章皆由CC-4.0协议发布,转载请注明出处。
使用智语AI写作智能工具,您将体验到ChatGPT中文版的强大功能。无论是撰写专业文章,还是创作引人入胜的故事,AI助手都能为您提供丰富的素材和创意,激发您的写作灵感。您只需输入几个关键词或主题,AI便会迅速为您生成相关内容,让您在短时间内完成写作任务。
利用AI智能写作工具,轻松生成高质量内容。无论是文章、博客还是创意写作,我们的免费 AI 助手都能帮助你提升写作效率,激发灵感。来智语AI体验 ChatGPT中文版,开启你的智能写作之旅!
评论(没有评论)
利用智语AI写作工具,轻松生成高质量内容。无论是文章、博客还是创意写作,我们的免费 AI 助手都能帮助你提升写作效ai率,激发灵感。来智语AI体验ChatGPT中文版,开启你的智能ai写作之旅!
0