共计 879 个字符,预计需要花费 3 分钟才能阅读完成。
根据《华尔街日报》的最新消息,OpenAI 正在研发的下一代大型语言模型 GPT-5 的开发进程未能如预期进展, 并且目前取得的成果与其投入的巨额成本并不相符。

这一消息与之前《The Information》的一篇文章相互印证,该文章提到 OpenAI 正在考虑新的策略, 因为 GPT-5 可能无法像其前代模型那样实现显著的性能提升。《华尔街日报》的报道进一步揭示了代号为“猎户座”(Orion)的 GPT-5 在长达 18 个月的研发过程中的更多细节。
报道指出,OpenAI 至少进行了两轮大规模的训练,旨在通过海量数据提升模型的表现。第一次训练的效率未达到预期,这意味着更大规模的训练将需要耗费更多的时间与资金。尽管 GPT-5 的性能据称优于先前的版本, 但其进步幅度尚不足以证明持续运行该模型所需的高昂成本合理。
此外,报道提到,OpenAI 除了利用公开数据和许可协议外,还雇佣人员通过编写代码或解决数学问题来创造新的数据。该公司还在利用其另一个模型 o1 生成的合成数据。
截至 IT 之家发稿时,OpenAI 尚未对此消息作出回应,而该公司此前已表示,今年不会推出代号为“猎户座”的新模型。
报道称 OpenAI 的新模型 GPT-5 开发遇阻,成本过高且效果未达预期
预训练阶段遭遇数据瓶颈早已被广泛预测。我提出一个激进的看法,如果没有意外情况,预训练模型的能力或许就在 GPT-4 的水平,GPT-5 可能永远无法问世。
结合预训练模型与 MCTS 才是正确的方向,如果 o3 的效果没有作弊,那么我相信 AGI 在未来几年内实现的可能性相当大,至少许多领域将会迎来各自的 AlphaGo 时刻。
不过,我对 o3 能够取得如此优秀效果的主要原因感到怀疑,可能是由于数据泄露造成的……