AI在线 AI在线

刚刚!OpenAI 上线 o3-pro,性能碾压 Gemini 与 Claude,重新定义“模型”

OpenAI发布了它自称“迄今为止最强大”的模型:o3-pro。   ——这是此前发布的推理模型 o3 的“加强版”。 图片o3-pro属于“推理模型”,它可以一步步拆解问题、逻辑严密地得出结论。

刚刚!OpenAI发布了它自称“迄今为止最强大”的模型:o3-pro。

  ——这是此前发布的推理模型 o3 的“加强版”。

图片图片

o3-pro属于“推理模型”,它可以一步步拆解问题、逻辑严密地得出结论。这种能力使它在物理、数学、编程等严谨性要求较高的领域表现更为稳定可靠。

OpenAI宣称,在评估中,o3-pro在所有测试领域都优于基础版o3,尤其在科学、教育、写作辅助、商业分析和编程等领域,获得了评审的一致好评。它不仅在准确性、清晰度、全面性上表现更强,还更擅长理解复杂指令。

目前,o3-pro已经上线:

  • ChatGPT Pro 和 Team 用户已可使用(取代旧版 o1-pro);
  • 企业和教育用户将在下周获得权限;
  • 开发者API也已经接入,价格为每百万输入tokens 20美元,输出tokens 80美元。

顺便说一句,百万输入tokens大约等于75万字——比《战争与和平》还要长一点。

图片图片

除了基础对话能力,o3-pro还拥有多项高级功能:联网搜索、视觉识别、Python工具调用、文件分析、甚至可以基于记忆进行个性化响应。但也并非完美无缺:

例如,暂时不支持图片生成;Canvas 工作区功能不兼容;临时对话功能暂时关闭;响应速度相比o1-pro略慢。

不过在一系列专业基准测试中,o3-pro打败了Google的Gemini 2.5 Pro和Anthropic的Claude 4 Opus,尤其是在AIME 2024(高难数学测试)和GPQA Diamond(博士级科学测试)中斩获佳绩。

图片图片

而这场替换来的悄无声息。没有发布会,也没有 demo 视频。OpenAI 用惯常方式在 changelog 中写道:“评审一致认为 o3-pro 在科学、教育、编程、商业和写作帮助等关键领域优于 o3。”评价中,“清晰度”“全面性”“指令执行力”“准确性”成为关键词。

One more thing

图片图片

除了新模型,还有另一个消息:

OpenAI 原计划在 6 月发布的开源模型——推迟了。

6 月 10 日,Sam Altman 在 X 上发文宣布:开源模型将延迟至“夏末”上线。他写道:“我们的研究团队做了一些意想不到又非常惊艳的事情,我们相信这非常值得等待,但还需要一点时间。”

这本应是 OpenAI 多年来首个真正意义上的开源权重模型。据称,它将具备与 o 系列相似的“推理能力”,目标是超越当前最强开源推理模型,如 DeepSeek 的 R1。而在这条时间线上,OpenAI 已落后一步——就在同一天,Mistral 发布了自家首个推理模型家族 Magistral;更早之前, Qwen 推出了一套支持推理与快速切换的混合模型。

据 TechCrunch 报道,OpenAI 此前内部也在讨论给开源模型接入云端能力,例如复杂问题时自动请求 OpenAI 云模型协助。但这些功能最终是否会出现在首发版本中,尚未可知。

Altman 曾公开承认,OpenAI 在“开源与封闭”的争议中站到了“历史错误的一边”。这次推迟,某种意义上,是技术节奏的调整,也可能是一次产品路线的重新权衡。

推理模型显然是今年 AI 赛道的新焦点:更像人类思维、更少幻觉、更适用于复杂任务。但当商业化模型抢占企业市场,开源模型抢占开发者生态,OpenAI 是否还能两头通吃?

真正的问题是:它还来得及夺回“开源”的主动权吗?

相关资讯

OpenAI更新o3-mini模型,展示了给出答案的 “思维链”

近日,OpenAI 在推出其旗舰 AI 模型 o3和 o3-mini 后,进行了重大更新,改变了 o3-mini 的回应方式。 现在,这款模型不仅能够回答用户的问题,还能展示其思考过程,为用户提供更多透明度。 这一变化标志着 OpenAI 在提升用户体验方面迈出了重要一步,使得 AI 工具的使用变得更加人性化。
2/7/2025 2:40:00 PM
AI在线

OpenAI 最强推理模型、能够“思考”图片,o3 和 o4-mini 正式发布

OpenAI 官方介绍称,这是其在 o 系列模型中最新训练的成果,可以在回答前进行更长时间的思考,也宣称是“迄今为止 OpenAI 发布的最智能的模型”,代表了 ChatGPT 能力的一次重大飞跃,从好奇的用户到高级研究人员都将因此受益。
4/17/2025 1:27:45 AM
汪淼

o3智商高达157?每13333人中才有一个这么高,网友:编码分数无意义

从韦氏智商测试来看,如果 o3 的 IQ 真这么高,则称得上非常优秀。 OpenAI o3 的智商(IQ)竟然已经这么高了吗今天,Reddit 上一则热帖宣称「OpenAI o3 的 IQ 估计为 157」,并放出了一张数据图。 这意味着什么呢?
12/24/2024 1:21:00 PM
机器之心
  • 1