共计 1756 个字符,预计需要花费 5 分钟才能阅读完成。
GPT- 5 发布会:AI 编程的新纪元与挑战
在最近的 OpenAI 发布会上,展示了 GPT- 5 在编程方面的能力。与会者对此反应热烈,有人直言现在大家都在进行“vibe coding”,换句话说,就是“编程抽卡”。同样的指令每次执行出来的结果都可能各不相同,因此,最有效的方式就是同时启动多个 AI,毕竟你只需进行复制粘贴操作而已。
我认为 GPT- 5 只是众多“vibe coding”选项中的一个,并不是说它的表现不理想,而是如今市场上类似水平的 AI 已经有好几个,彼此之间的差距并不明显。因此,最聪明的做法就是将同一个指令投放给所有的 AI。
根据官方资料,GPT- 5 在三个主要领域有所提升:写作、编程和健康。
写作的评价往往带有主观色彩,有些人对优美的文章并不感冒,他们更青睐直接明了的表达;而在健康方面,考虑到 AI 模型不能提供医疗建议,我也不便多做评论。
相对而言,编程的评价更为客观。
Claude 最近发布的 Claude-4.1-Opus 在编程评分上与 GPT- 5 非常接近。


然而,在各类 AI 编码工具的表现上,Claude 的优势明显。如果 Claude 能够降低定价,GPT- 5 的吸引力就会大打折扣。
我自己进行了测试,发现 Claude 在完成马赛克编程任务时表现远胜于 GPT-5。
从设计理念来看,GPT- 5 似乎更注重布局、图标及界面的美观,而在功能性方面却显得不足,尤其与 Claude 相比,后者不仅提供了三个独立可移动的界面,还在主界面上增加了许多实用功能,例如放大缩小、区域选择、复制粘贴等。

从这些方面来看,GPT- 5 在实际编程应用上,尤其是在 AI 代理整合方面的表现令人担忧。
是不是觉得眼前一亮?刚推出的 GPT- 5 似乎并没有想象中那么强大,与 Claude 的竞争也是势均力敌。这背后其实反映了一个严峻的事实:AI 技术的发展速度,已经远远超出了普通用户“CTRL+C/V”的学习速度。
如果我们仅仅停留在“编程抽卡”的层面,今天追逐 GPT,明天又转向 Claude,后天或许又会出现新模型,这样的被动追赶不仅效率低下,更难以建立自身的技术壁垒。当大多数人还在争论哪个模型“更好用”时,真正的高手早已在研究如何使“模型为我所用”。
当各大公司以 70W+ 年薪 争抢 AI 开发人才时,市场信号已经非常明确:仅仅会“编程抽卡”的时代即将过去,能够深入掌握 AI 底层技术的开发者,才是高薪职位的追求目标。
想要成为后者吗?那就来参加这门【AI 大模型技术原理 + 应用开发 + 模型训练】公开课,它将帮助你掌握核心原理、主流开发框架及模型微调技术,助你构建完备的知识体系。
许多看似复杂的概念,实际上可以通过系统化的课程轻松掌握其核心内容。一旦突破这层障碍,你会发现大模型的应用并没有比普通的开发困难太多。
当然,课程中还有很多亮点,其中之一就是新增的“AI 人格”。默认的 GPT 性格是标准风格:清晰、中立、适应性强。
此外,OpenAI 还增加了四种可选的人格:
- Cynic (愤世嫉俗者):风格讽刺、冷幽默,常用犀利的言辞开玩笑,但最终会给出直接且实用的回答。
- Robot (机器人):风格精确、高效且无情感,回答直接,毫不拖泥带水。
- Listener (倾听者):风格温暖、随和,能够平静清晰地复述你的想法,并带有一丝轻松的幽默感。
- Nerd (书呆子 / 极客):风格有趣且充满好奇心,喜欢清晰地解释概念,并对知识与发现充满热情。

这种创新特性或许会催生出一门新兴学科,“大模型心理学”。
此外,GPT- 5 还引入了全新的“统一系统”(Unified System)架构,其核心是一个 AI 驱动的“实时路由器”(Real-time Router)。
简单来说,它的功能是“将合适的任务分配给合适的大模型”。
它能够即时解析用户指令,并智能地将任务分配给最合适的内部模型——简单任务由高效模型迅速响应,而复杂问题则由强大模型进行深入分析。
最终目标是最大化算力的利用,同时持续优化任务分配逻辑,以实现模型与用户之间更高的默契度。

实际上,这一过程要复杂得多,GPT- 5 提到的是在完成大部分工作后,剩余的边角任务可以分配给如 nano 或 mini 等小型模型。
总的来说,GPT- 5 的性能仍然处于第一梯队,但是否能称之为绝对的第一则另当别论。不过,目前在价格方面它确实具备一定优势,更多的性能表现还需通过实际测试来验证。
来源:原文链接