刚刚，OpenAI开放GPT-4.1，100万上下文、代码能力超强

作者： 2025-05-15 09:16

今天凌晨1点30，OpenAI宣布开放GPT-4.1，从今天开始可以在ChatGPT中使用。 GPT-4.1是一款专门针对编码任务和指令执行的模型，推理效率非常高，对于日常编码需求来说，是替代o3和o4-mini非常好的选择。 GPT-4.1是OpenAI发布的最新模型，其最大亮点之一就是支持100万tokens上下文，这也是OpenAI首次发布长窗口模型。

今天凌晨1点30，OpenAI宣布开放GPT-4.1，从今天开始可以在ChatGPT中使用。

GPT-4.1是一款专门针对编码任务和指令执行的模型，推理效率非常高，对于日常编码需求来说，是替代o3和o4-mini非常好的选择。

GPT-4.1是OpenAI发布的最新模型，其最大亮点之一就是支持100万tokens上下文，这也是OpenAI首次发布长窗口模型。

与前代模型相比，GPT-4.1、GPT-4.1Mini和GPT-4.1Nano能够处理多达100万tokens的上下文，是GPT-4o的8倍。

OpenAI在LongContextEvals上对长文本进行了测试，测试结果显示，GPT-4.1系列的三个模型均能够在语料库的任何深度找到目标文本，无论是开头、中间还是结尾，甚至在长达100万tokens的上下文中，模型依然能够准确地定位目标文本。

OpenAI还在Multi-RoundCoreference进行了测试，通过创建合成对话来测试模型在长上下文中的理解和推理能力。

在这些对话中，用户和助手交替进行对话，用户可能会要求模型生成一首关于某个主题的诗，接着要求生成另一首关于不同主题的诗，然后可能要求生成一个关于第三个主题的短故事。模型需要在这些复杂的对话中找到特定的内容，例如“第二篇关于某个主题的短故事”。

测试结果显示，GPT-4.1在处理长达128Ktokens的数据时显著优于GPT-4o，并且在长达100万tokens的上下文中依然能够保持较高的性能。

在编码能力测试中，SWEBench评估将模型置于Python代码库环境，让其探索代码库、编写代码和测试用例。结果显示，GPT-4.1的准确率达到55%，而GPT-4o仅为33%。

在多语言编码能力测试方面，Aderpolyglot基准测试涵盖多种编程语言和不同格式要求。GPT-4.1在差异性能上较GPT-4o提升一倍，在处理多语言编程任务、代码优化和版本管理时更高效。

在指令遵循能力测试中，OpenAI构建内部评估体系，模拟API开发者使用场景，测试模型对复杂指令的遵循能力。每个样本包含分属不同类别的复杂指令，并分难度等级。在困难子集评估中，GPT-4.1远超GPT-4o。

在多模态处理测试的视频MME基准测试中，GPT4.1对30-60分钟无字幕视频进行理解并回答多项选择题，取得72%的成绩，达到当前最佳水平，在视频内容理解上实现重大突破。

价格方面，GPT-4.1系列在性能提升的同时，价格更具竞争力。GPT-4.1相比GPT-4o价格降低26%，而GPT-4.1Nano作为最小、最快且最便宜的模型，每百万token的成本仅为12美分。

目前，Plus、Pro和Team用户可以通过模型选择器中的“更多模型”使用GPT-4.1。企业和教育用户将在接下来的几周内获得访问权限。

OpenAI还在ChatGPT中为所有用户推出GPT-4.1-mini，取代GPT-4o-mini。

深度揭秘OpenAI如何让GPT-5「技术性」超越Claude：悄悄跳过最难的23道题

几天前，OpenAI发布会上，奥特曼宣布GPT-5登顶了，号称代码能力全球第一。但发布会上搞了一个大乌龙，52.8＞69.1=30.8？于是，OpenAI那些年薪上亿的天才们做的一张表格火遍了全世界（左边）。

8/20/2025 12:24:23 PM

实测o3/o4-mini：3分钟解决欧拉问题，OpenAI最强模型名副其实！

号称“OpenAI迄今为止最强模型”，o3/o4-mini真实能力究竟如何？就在发布后的几小时内，网友们的第一波实测已新鲜出炉。最强推理模型o3，即使遇上首位全职提示词工程师Riley Goodside的“刻意刁难”，也顺利过关：图片可以看到，面对藏在一堆玩具里的手绘图表，它也能通过图像识别和推理能力正确解答。

4/18/2025 11:18:51 AM 量子位

OpenAI发布代码Agent：开启自动化编程时代，超强智能体！

OpenAI在官网发布了一个全新基于云端的代码Agent——Codex。 Codex可以为开发人员自动执行多种任务，例如，编写功能代码、回答有关代码库的问题、修复错误以及提出拉取请求审查等；每个任务都在自己的云端沙盒环境中运行，同时能预加载用户的代码库。据悉，Codex由Codex-1模型提供支持，这是OpenAI-o3的一个微调版本，专门针对软件工程进行了优化。

5/19/2025 9:10:00 AM

刚刚，OpenAI开放GPT-4.1，100万上下文、代码能力超强

相关资讯

深度揭秘OpenAI如何让GPT-5「技术性」超越Claude：悄悄跳过最难的23道题

实测o3/o4-mini：3分钟解决欧拉问题，OpenAI最强模型名副其实！

OpenAI发布代码Agent：开启自动化编程时代，超强智能体！