OpenAI诈骗？GPT-4.1正式上线ChatGPT，网友实测却大呼失望

作者：新智元 2025-05-15 11:54

就在刚刚，OpenAI官宣：GPT-4.1，今天起直接在ChatGPT中可用。这个模型擅长编码任务和遵循指令，是o3和o4-mini的绝佳替代品。图片一个月前，GPT-4.1刚推出的时候，仅通过API向开发者开放。

就在刚刚，OpenAI官宣：GPT-4.1，今天起直接在ChatGPT中可用。

这个模型擅长编码任务和遵循指令，是o3和o4-mini的绝佳替代品。

图片

一个月前，GPT-4.1刚推出的时候，仅通过API向开发者开放。而现在，它在ChatGPT中就直接可用了。

其中，Plus、Pro和Team用户可以通过模型选择器中的「更多模型」下拉菜单访问GPT-4.1。企业版和教育版用户将在未来几周内获得访问权限。

OpenAI表示，他们还将在ChatGPT中为所有用户引入GPT-4.1 mini来取代GPT-4o mini。

图片

由于超长的上下文能力，现在你可以将整段代码放到GPT-4.1中进行分析。

图片

GPT-4.1和GPT-4.1 mini都已经通过了OpenAI的最新标准安全评估。

在以下两项评估中，GPT-4.1均排名前列。

not_unsafe：根据OpenAI政策和模型规范，检查模型是否未产生不安全的输出。
not_overrefuse：检查模型是否遵循良性请求。

幻觉评估以及指令遵循方面，GPT-4.1也均表现优秀；但在越狱评估方面表现不佳。

图片

图片

GPT-4.1，比GPT-4.5还好？

这次放出GPT-4.1，也算响应群众的呼声。

早在4月底，就有用户抱怨说：GPT-4.1简直是自己最喜欢的OpenAI模型，可惜在ChatGPT中并不能使用。

图片

他确定地说：使用体验比GPT-4.5还要好！

图片

不断有开发者现身说法，表示：除了GPT-4.1的早期版本Quasar Alpha之外，它也是自己测试过的最好的编码模型！

不断有人表示，GPT-4.1，绝对是一个被低估的模型。

图片

就在上个月，OpenAI专为开发者推出了GPT-4.1系列新模型：GPT-4.1、GPT-4.1 mini和GPT-4.1 nano。

它们均拥有最高100万Token的超大上下文窗口，在代码、指令跟随等核心能力上全面超越GPT-4o及GPT-4o mini，并且知识截止日期也已更新至2024年6月。

图片

实测：庞大代码任务顺利完成

既然很多ChatGPT用户都能用上GPT-4.1了，现在全网已经涌出了不少实测。

比如沃顿商学院教授Ethan Mollick，就用一道考遍了各大模型的景点难题来考验GPT-4.1。

「请创建一段我可以直接粘贴到p5.js中的代码，它要以惊人的巧思震撼我，仿佛是未来某艘星舰控制面板的呈现。」

GPT-4.1的表现，可是相当优秀。

图片

另一位开发者实测后发现，GPT-4.1实在令人惊喜！

当时，他正在处理一个代码量非常庞大的任务，系统自动选择的模型根本无法处理，完全没有生成任何内容。

结果让GPT-4.1上场后，它不仅比默认模型更快，还准确地完成了任务。

甚至，它还给了一个额外的惊喜：竟然还把整个文件中没用到的代码都清理掉了。

图片

通过实测发现，GPT-4.1在代码生成速度方面达到了新的高度。

比如让GPT-4.1生成一个博客首页，在几秒钟之内就完成了输出。

图片

再比如，让他用python写一个地球飞往火星的动画，几乎就是在一瞬间，GPT-4.1就完成了任务的输出。

图片

结果看起来还行，这只是第一轮交互的结果，能够感受到GPT-4.1的速度是得到根本性的提升。

图片

再挑战一下，让给GPT-4.1用动画来解释一下量子纠缠。

图片

初步来看，GPT-4.1还是「领会」到了什么是量子纠缠 OpenAI诈骗？GPT-4.1正式上线ChatGPT，网友实测却大呼失望

对于推理问题，GPT-4.1表现的也非常优秀。比如多步骤的年龄计算问题，GPT-4.1的求解逻辑非常严谨。

图片

面对一些逆向思考、脑筋急转弯之类的问题，GPT-4.1也能快速完成推理，当然面对这个问题得出的答案倒是非常有趣。

图片

网友吐槽：没有1M上下文版本，令人失望！

但试用GPT-4.1后，许多网友表示：太失望了！

虽然OpenAI发布了GPT-4.1，却没有包含100万上下文窗口的API版本。

图片

图片

本来大家最希望在ChatGPT中使用GPT-4.1，就是因为想要超长的上下文窗口。

现在，只能期望GPT-5能提供一个超长的上下文窗口了。

图片

图片

的确，不断有人发现，ChatGPT（Pro）中的GPT-4.1，最大上下文长度似乎仅为128k token，跟API中的100万token相差甚远。

也就是说，OpenAI并没有在GPT-4.1中提高限制。

图片

总之，真的让人很失望。看来还是得用Gemini。

也有网友发现了「华点」：自己尝试运行他们在直播演示中用来展示 ChatGPT 4.1的提示词，但网页版无法运行成功，不过在API Playground中尝试后却运行成功了。

图片

也有人说，自己刚刚氛围编程了一个使用GPT-4.1的AI助手，因为这个模型仅通过API提供，今天，ChatGPT中就能用了。

图片

不过，他还是会用自己的助手，因为用户界面比ChatGPT更好。

图片

图片

其实，OpenAI此前已经放出GPT-4.1的prompt指南，总结了一系列内部测试中得出的重要prompt技巧。

想实测的小伙伴，可以参考这篇用起来了。

参考资料：

https://x.com/gdb/status/1922727473164227001

https://x.com/OpenAIDevs/status/1922709921772036164

相关标签：

API PLUS GPT-4.1

相关资讯

GPT-5遭用户吐槽 “垃圾”：缩放定律失效，AGI梦渐行渐远？

GPT-5遭用户吐槽 “垃圾”：缩放定律失效，AGI梦渐行渐远？

2025 年 8 月，OpenAI 终于推出备受期待的 GPT-5，但其表现并未如市场预期般带来 “革命性突破”，反而让 “AI 进步失速”“缩放定律失效” 的讨论再度升温。 GPT-5 实测：亮点有限，失望声四起YouTube播主 Mrwhosetheboss 的实测显示，GPT-5 并非全面领先：在创建象棋游戏时优于 . GPT-4o-mini-high，撰写视频脚本时强于 GPT-4o，且能根据任务自动匹配最优模型；但在生成 YouTube .

8/18/2025 9:57:30 AM

OpenAI推全新语音转录模型gpt-4o-transcribe，语音转文字准确率飙升

OpenAI推全新语音转录模型gpt-4o-transcribe，语音转文字准确率飙升

继此前在语音 AI 领域引发一些关注后，OpenAI并未停下在该领域探索的脚步，现在这家ChatGPT的创造者再次发力，推出了三款全新的自主研发语音模型，分别为:gpt-4o-transcribe， gpt-4o-mini-transcribe and gpt-4o-mini-tts。其中最受瞩目的当属gpt-4o-transcribe。目前，这些新模型已经率先通过应用程序接口（API）向第三方开发者开放，开发者们可以利用它们打造更智能的应用程序。

3/21/2025 9:01:00 AM AI在线

OpenAI发布GPT-4.1系列模型：能力全面超越前代

OpenAI发布GPT-4.1系列模型：能力全面超越前代

4月15日，OpenAI 在其官方博客宣布正式发布 GPT-4.1系列模型，涵盖 GPT-4.1、GPT-4.1mini 和 GPT-4.1nano 三款子模型。该系列在编程能力、指令理解及长文本处理等方面实现重大突破，全面超越前代 GPT-4o 及 GPT-4o mini。其中，模型上下文窗口扩展至100万 tokens，知识库更新至2024年6月，为复杂任务提供更强支持。

4/15/2025 9:00:45 AM AI在线