共计 2243 个字符,预计需要花费 6 分钟才能阅读完成。
GPT-4.1 现已在 ChatGPT 平台上正式上线!不仅如此,这一版本在 API 中也已开放,Plus、Pro 和 Team 用户均可使用。许多网友在体验后纷纷表示:OpenAI 这是不是在玩诈骗?说好的百万字的上下文呢?
就在刚刚,OpenAI 发布消息:从今天起,GPT-4.1 可以直接在 ChatGPT 中使用。
该模型特别擅长编码任务并能有效遵循指令,是 o3 和 o4-mini 的理想替代选择。
大约一个月前,GPT-4.1 刚发布时,仅开放了 API 给开发者使用。而如今,它已经可以直接在 ChatGPT 中访问了。
Plus、Pro 和 Team 用户可以在模型选择器的“更多模型”下拉菜单中找到 GPT-4.1。企业版和教育版用户将在接下来的几周内获得使用权限。
OpenAI 还表示,他们将在 ChatGPT 中推出 GPT-4.1 mini,替代之前的 GPT-4o mini。
凭借其超长上下文处理能力,现在用户可以将完整的代码段输入到 GPT-4.1 进行深入分析。
GPT-4.1 及其 mini 版本均已通过 OpenAI 最新的安全标准评估。
在两个评估维度中,GPT-4.1 的表现均名列前茅。
- not_unsafe:根据 OpenAI 的政策和模型规范,评估模型是否未生成不安全的内容。
- not_overrefuse:评估模型是否能够有效响应合理的请求。
在幻觉评估及指令遵循测试中,GPT-4.1 也展现出色;然而,在越狱评估中,其表现却稍显不足。
GPT-4.1,是否优于 GPT-4.5?
此次发布的 GPT-4.1 可以说是对用户需求的积极回应。
早在四月底,就有用户对此表达了不满,称 GPT-4.1 是他们最钟爱的 OpenAI 模型,然而却无法在 ChatGPT 中使用。
他明确表示,使用体验要比 GPT-4.5 更出色!
许多开发者纷纷分享他们的见解,指出除了早期版本 Quasar Alpha 外,GPT-4.1 也是他们测试过的最佳编码模型!
越来越多的人认为,GPT-4.1 无疑是一个被严重低估的模型。
就在上个月,OpenAI 特别为开发者推出了 GPT-4.1 系列新模型,包括 GPT-4.1、GPT-4.1 mini 和 GPT-4.1 nano。
测试结果:强大的代码任务顺利解决
随着越来越多的 ChatGPT 用户开始体验 GPT-4.1,网络上也随之涌现出众多的使用测试。
例如,沃顿商学院的 Ethan Mollick 教授,便用一个考验各大模型的景点难题来检验 GPT-4.1 的能力。
他询问道:“请为我生成一段可以直接粘贴到 p5.js 中的代码,要求极具创意,宛如未来某艘宇宙飞船的控制面板。”
GPT-4.1 的表现可圈可点,令人印象深刻。
另一位开发者在进行测试时,也对 GPT-4.1 的表现感到惊喜!
当他面临一个代码量极大的任务时,系统自动选择的模型无法应对,完全没有生成任何结果。
但当 GPT-4.1 接手后,不仅速度明显提升,还准确地完成了任务。
更令人意外的是,它还自动清理了文件中未使用的代码。
经过实测,GPT-4.1 在代码生成速度上达到了新的高度。
例如,当要求它生成一个博客首页时,仅用了几秒钟便完成了输出。
再比如,他让 GPT-4.1 用 Python 编写一个地球飞往火星的动画,几乎在刹那间便完成了任务的输出。
初步结果相当令人满意,这仅仅是第一次交互的结果,已能明显感受到 GPT-4.1 在速度上的根本性提升。
进一步挑战,开发者让 GPT-4.1 用动画来阐释量子纠缠的概念。
初步看来,GPT-4.1 似乎“理解”了量子纠缠的概念。
用户反馈:缺乏 1M 上下文版本,令人失望!
试用 GPT-4.1 后,许多用户感到非常失望。
尽管 OpenAI 推出了 GPT-4.1,却并未提供具有 100 万上下文窗口的 API 版本。
用户原本希望在 ChatGPT 中能体验到 GPT-4.1 的强大,尤其是超长的上下文窗口。
现在,大家只能期待 GPT- 5 能实现这个愿望。
事实上,越来越多的人发现,ChatGPT(Pro)中使用的 GPT-4.1,最大上下文长度似乎仅为 128k token,这与 API 中的 100 万 token 相比,差距显著。
这意味着,OpenAI 并没有在 GPT-4.1 中扩展上下文限制。
令人失望的体验:转向 Gemini 的必要性
总的来说,这次体验让人感到非常失望。我们似乎只能依赖 Gemini 来满足我们的需求。
有网友提到一个有趣的现象:他们尝试使用直播演示中展示的 ChatGPT 4.1 的提示词,但在网页版上却未能成功运行。然而,当他们转向 API Playground 时,却顺利运行了。
另外,有用户分享了自己刚刚编写的一个 AI 助手,使用了 GPT-4.1 模型。由于该模型仅通过 API 提供,今天,这个助手已经能够在 ChatGPT 中使用了。
尽管如此,他依然选择使用自己的助手,因为其用户界面的体验明显优于 ChatGPT。
值得注意的是,OpenAI 早前已发布了 GPT-4.1 的提示指南,概述了从内部测试中总结出的关键提示技巧。
想要亲自体验的朋友,可以参考相关的使用指南。
参考资料:
https://x.com/gdb/status/1922727473164227001
https://x.com/OpenAIDevs/status/1922709921772036164
本文由微信公众号“新智元”发布,作者:ZNX,经过 36 氪的授权。