AI在线 AI在线

GPT-5

GPT-5“变笨”实锤,退休教授出了道井字棋送分题,结果它真送了

西风 发自 凹非寺. 量子位 | 公众号 QbitAI退休经济学教授用一个简单问题干懵GPT-5,其拉胯表现与奥特曼口中“博士级AI”的宣传大相径庭。 问题很简单,关于咱小时候都玩过的“井”字棋游戏。
9/1/2025 3:54:17 PM
西风

GPT-5冷酷操盘,狼人杀一战封神!七大LLM狂飙演技,人类玩家看完沉默

一群模型去玩狼人杀,谁能夺下冠军? 这不,GPT-5、Gemini 2.5 Pro、Qwen3-235B-Instruct、GPT-OSS-120B等七大顶尖模型组队,同擂台开战。 一共210场血战,最终,GPT-5以96.7%的胜率独占榜首。
9/1/2025 9:03:00 AM

被低估的GPT-5!OpenAI给7亿人解锁最强AI,大众智能一夜撕裂旧秩序

直到现在,GPT-5的升级,仍然被很多人低估了! 一方面是,很多人没有看透OpenAI发布GPT-5背后的真正原因。 GPT-5的「突破」不在性能,而是模型「自带路由」和思考配额分发下的「单位token经济学」。
9/1/2025 2:55:00 AM
新智元

「开发者私下更喜欢用GPT-5写代码」,Claude还坐得稳编程王座吗?

一直以来,Anthropic 的 Claude 被认为是处理编程任务的最佳模型,尤其是本月初发布的 Claude Opus 4.1,在真实世界编程、智能体以及推理任务上表现出色。 其中在软件编程权威基准 SWE-bench Verified 测试中,Claude Opus 4.1 相较于前代 Opus 4 又有提升,尤其在多文件代码重构方面表现出显著进步。 不过,在刚刚过去的这个周末,Claude 最强编程模型的地位似乎开始动摇了。
8/27/2025 11:35:00 AM
机器之心

首个接入GPT-5的视频Agent!一句话生成商业级广告大片,分镜配音字幕等全包了

AI视频生成,快速进入Agent时代! 只需一句提示词:生成一个F1赛车的现场解说视频。 AI即可自动完成分镜、画面、配音、字幕,生成结构完整、节奏在线的爆款视频。
8/25/2025 2:05:09 PM

GPT-5系统提示词突遭泄露,17803 token曝光OpenAI小心思!

新一版疑似GPT-5提示词,在GitHub上曝光了。 图片项目地址:(Tokenizer)中,提示词足足有17803 token,堪称「巨无霸」级别的指令。 图片这份文档出自Ásgeir Thor Johnson,他在Github上持续整理了几乎所有已经泄露的模型提示词。
8/25/2025 10:21:29 AM
新智元

比GPT-5还准?AIME25飙到99.9%刷屏,开源模型首次!

如何让模型在思考时更聪明、更高效,还能对答案有把握? 最近,Meta AI与加州大学圣地亚哥分校的研究团队给出了一个令人振奋的答案——Deep Think with Confidence(DeepConf),让模型自信的深度思考。 论文地址::「置信度筛选」,不仅让模型在国际顶尖数学竞赛AIME 2025上拿下了高达99.9%的正确率。
8/25/2025 8:53:00 AM

GPT-5点赞!八大顶尖机构发布「自进化智能体」全面综述

LLM驱动的AI智能体已展现出惊人潜力:它们以LLM为核心,集成感知模块(处理文本/图像/音频/视频)、规划模块(如链式思考CoT或树式思考ToT)、记忆模块(短期上下文存储与长期知识检索)和工具模块(调用API如搜索引擎或代码执行器)。 在单智能体系统中,这些组件协同工作,处理从网页导航、代码生成、投资辅助到生物医学分析的任务。 而在多智能体系统(MAS)中,智能体间通过协作(如辩论或任务分解)攻克复杂问题,模拟人类团队的群体智能。
8/21/2025 2:14:17 PM
新智元

GPT-5空间智能大考:简单任务称王,复杂挑战平手,所有模型都输给了人类

大家好,我是肆〇柒。 今天我们要探讨一篇由 DeepMind 联合 Stanford HAI(斯坦福以人为本人工智能研究院)共同发布的重磅实证研究报告。 这份报告首次对GPT-5的空间智能能力进行了系统性、标准化的全面评估,其结论可能会更加清晰我们对当前AI能力边界的认知。
8/21/2025 2:10:43 PM
肆零柒

刚刚,GPT-5 Pro自证全新数学定理!OpenAI总裁直呼颠覆,大佬们集体转发

AI真的能解决人类的前沿问题吗? 比如类似庞加莱猜想、求解麦克斯韦方程、费马大定理、黎曼猜想等问题。 今天这个问题有了答案。
8/21/2025 10:11:44 AM

奥特曼首曝GPT-6,亲口承认GPT-5「搞砸了」!接入大脑读心,估值或飙破5000亿

GPT-5还没捂热,奥特曼又来捧GPT-6了。 这几天,奥特曼在旧金山的采访中表示,「人们想要记忆功能,希望未来ChatGPT能让用户自定义语气和个性」。 虽未公布下一代AI模型的具体时间,但从奥特曼口中,可以感受出GPT-6确实不一样。
8/21/2025 9:05:00 AM

OpenAI豪赌5000亿美元估值神话:60亿股权大甩卖背后,GPT-5却遭用户冷遇

硅谷正在见证一场史无前例的估值狂欢。 OpenAI这个曾经的非营利组织,如今正准备通过一轮60亿美元的股权出售,将自己推向5000亿美元估值的云端——这个数字足以让它超越绝大多数上市公司,成为私营企业估值的新王者。 这场资本盛宴的背后,是OpenAI过去12个月里令人眩目的吸金能力。
8/20/2025 2:56:35 PM
AI在线

​甲骨文深度集成 GPT-5,助力企业智能化转型

近期,甲骨文公司(Oracle)宣布将 OpenAI 的最新人工智能模型 GPT-5嵌入到其云服务和软件即服务(SaaS)应用中。 这一举措将生成式 AI 的能力扩展到企业的数据库、HR、财务和供应链工具,为企业客户提供了更加智能化的解决方案。   在8月18日的发布会上,甲骨文表示,GPT-5已在其数据库、Fusion Cloud 应用以及 NetSuite 等平台上全面上线。
8/20/2025 2:56:35 PM
AI在线

OpenAI高管自爆:Scaling不死,GPT-5「双轴训练」撕开智能天花板

GPT-5的能力到底有什么提升与意义? 人工智能未来走向何处? 这款惊艳亮相的OpenAI新模型,如何揭示智能的多种形态?
8/20/2025 12:22:31 PM

OpenAI再加速:奥尔特曼预告GPT-6即将到来,主打个性化与记忆功能

尽管GPT-5刚刚问世,但OpenAI首席执行官萨姆·奥尔特曼已在上周的媒体活动中透露了公司未来的雄心。 他明确表示,GPT-6已经在开发中,并且其发布间隔将比GPT-4和GPT-5之间更短。 奥尔特曼强调,GPT-6的核心突破在于记忆和个性化,这将是实现真正个性化聊天体验的关键。
8/20/2025 10:06:01 AM
AI在线

GPT-5暴写「屎山代码」!14个Prompt,看穿GPT-1到GPT-5七年智商进化史

一张基准对比图,彻底火遍了全网。 GPT-5发布近半个月,实际表现未达预期,不少人感慨:苦等OpenAI两年,就是这? 为此,Peter Gostev将GPT-4和GPT-5在数学、软件工程、问答等基准上,做了一个直观对比。
8/19/2025 4:05:27 PM

GPT-5翻车实录:被寄予厚望的AI新王者,为何不如Claude?

昨天在Twitter上,一位开发者@Teknium1发了一条推文:"在多次尝试中,GPT-5(包括gpt-5-thinking-high max)表现不佳,不如Opus甚至Sonnet。 "这条推文迅速引爆了AI圈,成千上万的开发者开始分享自己的"翻车"经历。 作为一个从GPT-3时代就开始使用OpenAI产品的人,我对这次GPT-5的发布抱有极高期待。
8/19/2025 9:56:03 AM
阿丸笔记

OpenAI总裁透露GPT-5改了推理范式,AGI实现要靠现实反馈

OpenAI的AGI之路,总裁Greg Brockman在最新的访谈中说清楚了——技术层面,从文本生成转向强化学习的推理范式,在现实世界中试错并获取反馈;资源策略上,持续投入大规模计算资源;落地环节,把模型封装成Agent,将模型能力打包成为可审计的服务进程。 图片这场访谈由AI播客Latent Space主持,与Brockman探讨了OpenAI的AGI的整体技术路线与资源策略。 与此同时,OpenAI的落地布局,以及Brockman对未来的思考,也都随着访谈的进行浮出水面。
8/18/2025 5:14:41 PM
量子位