AI在线 AI在线

GPT-5:没有AGI,失望和天花板,最具竞争力的可能是定价

GPT-5 发布速记:刚看完GPT-5发布会,我对GPT-5整体感觉都已经在标题里了。 整个发布会一上来就出现多个错误图片,瞬间刷爆整个网络。 而Sam Altman 一直在发推说GPT-5有多好,比如代码能力远超vibecoding的范围。

GPT-5 发布速记:

刚看完GPT-5发布会,我对GPT-5整体感觉都已经在标题里了。

整个发布会一上来就出现多个错误图片,瞬间刷爆整个网络。

图片

而Sam Altman 一直在发推说GPT-5有多好,比如代码能力远超vibecoding的范围。

图片

市场对GPT-5比较失望,OpenAI在polymarket惨败。

图片

专家认为:GPT-5开发过于仓促,模型已经撞墙。

图片

就像大家知道的那样GPT-5有三个型号,是一个包含快速回答、深度思考和智能路由器的统一系统,能自主判断问题难度,决定是秒回还是深度思考,也可以通过提示词引导它think hard about this。

图片

所有人都可以免费访问,plus用量多一些,pro用户可以访问最多计算量。

GPT-5基础性能

可以这么说:

GPT-5 是没有推理能力的 o4.5,GPT-5-mini 是没有推理能力的 o4.5-mini。GPT-5-nano 本质上是 GPT-4.2。GPT-5-thinking 是带有少量推理能力的 o4.5。GPT-5-pro 是带有并行推理能力的 o4.5,而 o4.5 是带有推理能力的 GPT-4.5+。

图片

GPT-5在ARC-AGI 1和ARC-AGI 2表现不佳,还不如Grok 4。

图片

图片

GPT-5在大模型竞技场排第一,这个看看就好了。

图片

在人类最后的考试中就比ChatGPT Agent表现好一点,问题是ChatGPT Agent也比较鸡肋啊!

图片

训练截止时间:2024年知识截止,这个真的很糟,看起来确实是人类产生的的数据不够了?不过OpenAI的研发人员说GPT-5证明了合成数据的有效。

图片

400k 上下文窗口,符合预期。

非多模态输入。

GPT-5的幻觉症状明显改善,幻觉暴降80%。

图片

GPT-5 定价

GPT-5最大的亮点可能是极具竞争力的价格,定价与谷歌的Gemini 2.5 pro持平了,这个要表扬一下了,毕竟谷歌推理用的自己的芯片。

图片

GPT-5代码能力

OpenAI专门给开发者写了一个blog ,比较详细的说明了GPT-5代码能力,拉来了一大堆伙伴站台,比如cursor,windsurf,初步评价很猛,但是究竟与Claude 相比怎么样还是未知数。

cursor ceo评价:

GPT-5 是我们使用过的最智能的编码模型。我们的团队发现 GPT-5 非常智能,易于操控,甚至拥有我们在其他任何模型中都未曾见过的个性。它不仅能捕捉棘手、隐藏深层的 bug,还能运行长时间、多轮的后台代理,将复杂的任务进行到底——这类问题过去常常让其他模型陷入困境。它已经成为我们日常工作的驱动力,从范围界定和规划 PR,到完成端到端构建,无所不包。

图片

Windsurf 工程主管评价:

GPT-5 在我们的内部评估中处于 SOTA 阶段,该评估衡量了模型在现实世界软件工程任务中的表现。我们还发现,该模型的工具调用错误率仅为其他前沿模型的一半。它始终能够以连贯、易懂的方式解决复杂任务。

图片

具体的评估参数我就不放了,大家感兴趣可以去这里看:

https://openai.com/index/introducing-gpt-5-for-developers/

大家看后续测试吧,总结来说,感觉GPT-5是一个努力了很久的拼凑的模型,没有GPT-3到GPT-4的惊艳和震撼,更谈不上AGI。

相关资讯

OpenAI推全新语音转录模型gpt-4o-transcribe,语音转文字准确率飙升

继此前在语音 AI 领域引发一些关注后,OpenAI并未停下在该领域探索的脚步,现在这家ChatGPT的创造者再次发力,推出了三款全新的自主研发语音模型,分别为:gpt-4o-transcribe, gpt-4o-mini-transcribe and gpt-4o-mini-tts。 其中最受瞩目的当属gpt-4o-transcribe。 目前,这些新模型已经率先通过应用程序接口(API)向第三方开发者开放,开发者们可以利用它们打造更智能的应用程序。
3/21/2025 9:01:00 AM
AI在线

OpenAI发布GPT-4.1系列模型:能力全面超越前代

4月15日,OpenAI 在其官方博客宣布正式发布 GPT-4.1系列模型,涵盖 GPT-4.1、GPT-4.1mini 和 GPT-4.1nano 三款子模型。 该系列在编程能力、指令理解及长文本处理等方面实现重大突破,全面超越前代 GPT-4o 及 GPT-4o mini。 其中,模型上下文窗口扩展至100万 tokens,知识库更新至2024年6月,为复杂任务提供更强支持。
4/15/2025 9:00:45 AM
AI在线

OpenAI发布GPT-4.1系列模型,编码与多模态能力全面升级

人工智能领域的竞争日趋白热化,OpenAI再次以技术突破引领潮流。 AIbase从社交媒体获悉,OpenAI于近日通过API形式发布了三款全新模型:GPT-4.1、GPT-4.1mini和GPT-4.1nano。 这些模型在性能上全面超越现有GPT-4o及GPT-4o mini,尤其在编码、指令遵循和多模态能力上表现突出。
4/15/2025 10:01:37 AM
AI在线
  • 1