GPT-4.1正式上线,网友实测却纷纷表示失望,OpenAI到底在玩什么把戏?

共计 2243 个字符,预计需要花费 6 分钟才能阅读完成。

GPT-4.1 现已在 ChatGPT 平台上正式上线!不仅如此,这一版本在 API 中也已开放,Plus、Pro 和 Team 用户均可使用。许多网友在体验后纷纷表示:OpenAI 这是不是在玩诈骗?说好的百万字的上下文呢?

就在刚刚,OpenAI 发布消息:从今天起,GPT-4.1 可以直接在 ChatGPT 中使用。

该模型特别擅长编码任务并能有效遵循指令,是 o3 和 o4-mini 的理想替代选择。

大约一个月前,GPT-4.1 刚发布时,仅开放了 API 给开发者使用。而如今,它已经可以直接在 ChatGPT 中访问了。

Plus、Pro 和 Team 用户可以在模型选择器的“更多模型”下拉菜单中找到 GPT-4.1。企业版和教育版用户将在接下来的几周内获得使用权限。

OpenAI 还表示,他们将在 ChatGPT 中推出 GPT-4.1 mini,替代之前的 GPT-4o mini。

凭借其超长上下文处理能力,现在用户可以将完整的代码段输入到 GPT-4.1 进行深入分析。

GPT-4.1 及其 mini 版本均已通过 OpenAI 最新的安全标准评估。

在两个评估维度中,GPT-4.1 的表现均名列前茅。

  • not_unsafe:根据 OpenAI 的政策和模型规范,评估模型是否未生成不安全的内容。
  • not_overrefuse:评估模型是否能够有效响应合理的请求。

在幻觉评估及指令遵循测试中,GPT-4.1 也展现出色;然而,在越狱评估中,其表现却稍显不足。

GPT-4.1,是否优于 GPT-4.5?

此次发布的 GPT-4.1 可以说是对用户需求的积极回应。

早在四月底,就有用户对此表达了不满,称 GPT-4.1 是他们最钟爱的 OpenAI 模型,然而却无法在 ChatGPT 中使用。

他明确表示,使用体验要比 GPT-4.5 更出色!

许多开发者纷纷分享他们的见解,指出除了早期版本 Quasar Alpha 外,GPT-4.1 也是他们测试过的最佳编码模型!

越来越多的人认为,GPT-4.1 无疑是一个被严重低估的模型。

就在上个月,OpenAI 特别为开发者推出了 GPT-4.1 系列新模型,包括 GPT-4.1、GPT-4.1 mini 和 GPT-4.1 nano。

测试结果:强大的代码任务顺利解决

随着越来越多的 ChatGPT 用户开始体验 GPT-4.1,网络上也随之涌现出众多的使用测试。

例如,沃顿商学院的 Ethan Mollick 教授,便用一个考验各大模型的景点难题来检验 GPT-4.1 的能力。

他询问道:“请为我生成一段可以直接粘贴到 p5.js 中的代码,要求极具创意,宛如未来某艘宇宙飞船的控制面板。”

GPT-4.1 的表现可圈可点,令人印象深刻。

GPT-4.1 正式上线,网友实测却纷纷表示失望,OpenAI 到底在玩什么把戏?

另一位开发者在进行测试时,也对 GPT-4.1 的表现感到惊喜!

当他面临一个代码量极大的任务时,系统自动选择的模型无法应对,完全没有生成任何结果。

但当 GPT-4.1 接手后,不仅速度明显提升,还准确地完成了任务。

更令人意外的是,它还自动清理了文件中未使用的代码。

GPT-4.1 正式上线,网友实测却纷纷表示失望,OpenAI 到底在玩什么把戏?

经过实测,GPT-4.1 在代码生成速度上达到了新的高度。

例如,当要求它生成一个博客首页时,仅用了几秒钟便完成了输出。

GPT-4.1 正式上线,网友实测却纷纷表示失望,OpenAI 到底在玩什么把戏?

再比如,他让 GPT-4.1 用 Python 编写一个地球飞往火星的动画,几乎在刹那间便完成了任务的输出。

GPT-4.1 正式上线,网友实测却纷纷表示失望,OpenAI 到底在玩什么把戏?

初步结果相当令人满意,这仅仅是第一次交互的结果,已能明显感受到 GPT-4.1 在速度上的根本性提升。

GPT-4.1 正式上线,网友实测却纷纷表示失望,OpenAI 到底在玩什么把戏?

进一步挑战,开发者让 GPT-4.1 用动画来阐释量子纠缠的概念。

GPT-4.1 正式上线,网友实测却纷纷表示失望,OpenAI 到底在玩什么把戏?

初步看来,GPT-4.1 似乎“理解”了量子纠缠的概念。

用户反馈:缺乏 1M 上下文版本,令人失望!

试用 GPT-4.1 后,许多用户感到非常失望。

尽管 OpenAI 推出了 GPT-4.1,却并未提供具有 100 万上下文窗口的 API 版本。

用户原本希望在 ChatGPT 中能体验到 GPT-4.1 的强大,尤其是超长的上下文窗口。

现在,大家只能期待 GPT- 5 能实现这个愿望。

事实上,越来越多的人发现,ChatGPT(Pro)中使用的 GPT-4.1,最大上下文长度似乎仅为 128k token,这与 API 中的 100 万 token 相比,差距显著。

这意味着,OpenAI 并没有在 GPT-4.1 中扩展上下文限制。

令人失望的体验:转向 Gemini 的必要性

总的来说,这次体验让人感到非常失望。我们似乎只能依赖 Gemini 来满足我们的需求。

有网友提到一个有趣的现象:他们尝试使用直播演示中展示的 ChatGPT 4.1 的提示词,但在网页版上却未能成功运行。然而,当他们转向 API Playground 时,却顺利运行了。

另外,有用户分享了自己刚刚编写的一个 AI 助手,使用了 GPT-4.1 模型。由于该模型仅通过 API 提供,今天,这个助手已经能够在 ChatGPT 中使用了。

尽管如此,他依然选择使用自己的助手,因为其用户界面的体验明显优于 ChatGPT。

值得注意的是,OpenAI 早前已发布了 GPT-4.1 的提示指南,概述了从内部测试中总结出的关键提示技巧。

想要亲自体验的朋友,可以参考相关的使用指南。

参考资料:

https://x.com/gdb/status/1922727473164227001

https://x.com/OpenAIDevs/status/1922709921772036164

本文由微信公众号“新智元”发布,作者:ZNX,经过 36 氪的授权。

来源:今日头条
原文标题:OpenAI 诈骗?GPT-4.1 正式上线 ChatGPT,网友实测却大呼失望 – 今日头条
正文完
 0
小智
版权声明:本站原创文章,由 小智 于2025-09-29发表,共计2243字。
转载说明:除特殊说明外本站文章皆由CC-4.0协议发布,转载请注明出处。
使用智语AI写作智能工具,您将体验到ChatGPT中文版的强大功能。无论是撰写专业文章,还是创作引人入胜的故事,AI助手都能为您提供丰富的素材和创意,激发您的写作灵感。您只需输入几个关键词或主题,AI便会迅速为您生成相关内容,让您在短时间内完成写作任务。
利用AI智能写作工具,轻松生成高质量内容。无论是文章、博客还是创意写作,我们的免费 AI 助手都能帮助你提升写作效率,激发灵感。来智语AI体验 ChatGPT中文版,开启你的智能写作之旅!
利用智语AI写作工具,轻松生成高质量内容。无论是文章、博客还是创意写作,我们的免费 AI 助手都能帮助你提升写作效ai率,激发灵感。来智语AI体验ChatGPT中文版,开启你的智能ai写作之旅!