AI在线 AI在线

预训练“卡壳”:SemiAnalysis 爆料 OpenAI 连续两年半未跑通新前沿大模型

据 SemiAnalysis 最新报告,自2024年5月 GPT-4o 发布以来,OpenAI 尚未完成任何一次“面向下一代前沿模型”的大规模预训练部署,其顶尖团队多次尝试扩展参数与数据规模,均因收敛困难或性能倒挂而中途叫停。 这导致被外界寄予厚望的 GPT-5系列实质上仍是 GPT-4o 的优化变体,未能实现架构级突破。 与此同时,谷歌 TPUv7已在 Gemini3等模型上完成大规模预训练验证,同等算力集群的总体拥有成本(TCO)比英伟达方案低约30%。

据 SemiAnalysis 最新报告,自2024年5月 GPT-4o 发布以来,OpenAI 尚未完成任何一次“面向下一代前沿模型”的大规模预训练部署,其顶尖团队多次尝试扩展参数与数据规模,均因收敛困难或性能倒挂而中途叫停。这导致被外界寄予厚望的 GPT-5系列实质上仍是 GPT-4o 的优化变体,未能实现架构级突破。

与此同时,谷歌 TPUv7已在 Gemini3等模型上完成大规模预训练验证,同等算力集群的总体拥有成本(TCO)比英伟达方案低约30%。SemiAnalysis 指出,OpenAI 甚至“尚未真正部署 TPU”,仅传出评估消息,就迫使英伟达在现有 GPU 集群报价上让步,为 OpenAI 节省约三成成本——侧面凸显 TPU 的性价比优势。

行业观点认为,预训练 Scaling 定律正遭遇数据、算力与模型配方三重瓶颈:优质互联网数据接近枯竭,合成数据成本高达1亿美元/1TB,十万卡集群故障频发,更大规模 MoE 的超参数亦难摸索。OpenAI 的停滞被视为整个赛道进入“后 Scaling 时代”的标志性信号,各家开始转向推理模型、自博弈 RL 与多模态后训练寻求增量突破。

相关资讯

微软Azure全力支撑OpenAI新模型 GPT-5或于5月下旬震撼登场

据国外媒体报道,知情人士透露微软工程师团队正加速部署服务器资源,为OpenAI即将推出的GPT-4.5和GPT-5模型做技术储备。 尽管OpenAI CEO山姆·阿尔特曼(Sam Altman)近期确认GPT-4.5将在几周内亮相,但微软内部预计最快下周即可完成新模型的托管部署,这一动作暗示着生成式AI领域的技术竞赛已进入冲刺阶段。 代号为Orion的GPT-4.5被视作当前技术路线的“收官之作”。
2/21/2025 11:12:00 AM
AI在线

OpenAI 推出 GPT-5-Codex-Mini:更轻、更快、更省的开发者专用模型

OpenAI 近日正式发布 GPT-5-Codex-Mini,这是一款专为开发者打造的高性价比编程模型,继9月推出的 GPT-5-Codex 后,再次拓宽了智能编程的应用边界。 GPT-5-Codex 基于 GPT-5架构,专注提升代码推理与生成能力,能够在真实软件工程任务中执行包括新项目创建、功能扩展、测试编写与大规模代码重构等多类复杂操作。 其在 SWE-bench Verified 基准测试中取得74.5% 的高分,超越此前的 GPT-5High(72.8%),展现出显著性能优势。
11/10/2025 11:21:27 AM
AI在线

GPT-5「全家桶」爆出本周上线!惊艳首测秒出网页,编程彻底起飞

传闻称,GPT-5的发布时间提前了,预计在本月底面世。 图片网友爆料,GPT-5共有4个版本:GPT-5-pro(zenith)  GPT-5-high(summit)  GPT-5-mini  GPT-5-nano(starfish)图片周六,网友们提前放出了一些,OpenAI开源模型——代号为「lobster」的实测。 图片今天,更多关于GPT-5多个版本惊艳demo公开了。
7/28/2025 6:07:12 PM
新智元