AI在线 AI在线

OpenAI发布GPT-4.1系列模型:能力全面超越前代

4月15日,OpenAI 在其官方博客宣布正式发布 GPT-4.1系列模型,涵盖 GPT-4.1、GPT-4.1mini 和 GPT-4.1nano 三款子模型。 该系列在编程能力、指令理解及长文本处理等方面实现重大突破,全面超越前代 GPT-4o 及 GPT-4o mini。 其中,模型上下文窗口扩展至100万 tokens,知识库更新至2024年6月,为复杂任务提供更强支持。

4月15日,OpenAI 在其官方博客宣布正式发布 GPT-4.1系列模型,涵盖 GPT-4.1、GPT-4.1mini 和 GPT-4.1nano 三款子模型。该系列在编程能力、指令理解及长文本处理等方面实现重大突破,全面超越前代 GPT-4o 及 GPT-4o mini。其中,模型上下文窗口扩展至100万 tokens,知识库更新至2024年6月,为复杂任务提供更强支持。

GPT-4.1系列目前仅面向开发者开放,通过 API 接口提供服务,普通用户暂无法直接通过 ChatGPT 界面体验。OpenAI 透露,GPT-4.1在编程场景中代码生成速度较 GPT-4o 提升40%,同时用户查询成本降低80%,显著优化开发效率与成本。

OpenAI发布GPT-4. 1 全新系列模型!全面超越GPT-4o 更聪明、更便宜

OpenAI发布GPT-4. 1 全新系列模型!全面超越GPT-4o 更聪明、更便宜

性能表现:多项基准测试刷新纪录

  • 编程能力:在 SWE-bench Verified 测试中,GPT-4.1得分达54.6%,较 GPT-4o 提升21.4个百分点;
  • 指令遵循:MultiChallenge 测试中提升10.5个百分点;
  • 多模态处理:Video-MME 测试创下72.0% 新高。

    GPT-4.1mini 在多项测试中表现接近甚至超越 GPT-4o,延迟降低近50%,成本减少83%。而 GPT-4.1nano 作为轻量化版本,以100万 tokens 上下文窗口和80.1% 的 MMLU 得分,成为分类与自动补全任务的性价比之选。通过推理栈优化与提示缓存技术,系列模型首次响应时间大幅缩短,为开发者提供高效低成本的解决方案。

实际应用场景成效显著

  • 编程效率:Windsurf 测试显示,GPT-4.1编程效率提升30%,无效编辑减少50%;
  • 法律领域:Thomson Reuters 的法律 AI 助手 CoCounsel 接入 GPT-4.1后,多文档审查准确率提升17%。

GPT-4.1输入费用为每100万 tokens2美元(约合人民币14.6元),输出费用为8美元(约合人民币58.3元)。在中等查询场景中,GPT-4.1较 GPT-4o 性能提升的同时,成本降低26%。其中,GPT-4.1nano 凭借超低延迟与成本,成为 OpenAI 当前最经济的模型选择。

相关资讯

调查:超72% 的企业选择 AI 工具时最看重易用性

根据最近的一项 CIO 报告,企业在人工智能(AI)领域的投资高达2.5亿美元,尽管在证明投资回报率(ROI)方面面临挑战。 商业领袖们正努力提高生产力,但新技术的集成往往需要重构现有应用、更新流程并激励员工学习,以适应现代商业环境。 QuickBlox 首席执行官 Nate MacLeitch 对136位高管进行了调查,以揭示 AI 采用的现实情况,探讨领导者的首要任务、主要担忧以及他们在2025年寻找可信工具的信息来源。
3/18/2025 10:02:00 AM
AI在线

可保护作品免遭 AI 训练,Adobe 推出 Content Authenticity 应用

Adobe 推出全新应用 Content Authenticity,用于保护创意工作者的作品署名权,即使有人截屏并在网络二次传播也不受影响。这款网页应用于今日面向公众开放测试,用户上传需要保护的图像,应用就能嵌入隐形元数据和添加“禁止 AI 训练”标签,帮助确认作品归属和保护作品免遭 AI 训练。
4/24/2025 9:32:18 PM
准泽(实习)

城商行掀起大模型招标潮,百万级投入成行业新风口!

在人工智能技术快速发展的背景下,越来越多的城商行开始纷纷参与到大模型的招标中。 根据最新消息,超过10家中小银行近期启动了大模型相关项目的招标,标志着这一领域的竞争加剧。 这些银行希望通过大模型技术优化现有的金融服务流程,提高运营效率,进而为客户提供更优质的服务。
7/11/2025 11:11:51 AM
AI在线
  • 1