GPT-5
GPT-5“变笨”实锤,退休教授出了道井字棋送分题,结果它真送了
西风 发自 凹非寺. 量子位 | 公众号 QbitAI退休经济学教授用一个简单问题干懵GPT-5,其拉胯表现与奥特曼口中“博士级AI”的宣传大相径庭。 问题很简单,关于咱小时候都玩过的“井”字棋游戏。
9/1/2025 3:54:17 PM
西风
GPT-5冷酷操盘,狼人杀一战封神!七大LLM狂飙演技,人类玩家看完沉默
一群模型去玩狼人杀,谁能夺下冠军? 这不,GPT-5、Gemini 2.5 Pro、Qwen3-235B-Instruct、GPT-OSS-120B等七大顶尖模型组队,同擂台开战。 一共210场血战,最终,GPT-5以96.7%的胜率独占榜首。
9/1/2025 9:03:00 AM
被低估的GPT-5!OpenAI给7亿人解锁最强AI,大众智能一夜撕裂旧秩序
直到现在,GPT-5的升级,仍然被很多人低估了! 一方面是,很多人没有看透OpenAI发布GPT-5背后的真正原因。 GPT-5的「突破」不在性能,而是模型「自带路由」和思考配额分发下的「单位token经济学」。
9/1/2025 2:55:00 AM
新智元
「开发者私下更喜欢用GPT-5写代码」,Claude还坐得稳编程王座吗?
一直以来,Anthropic 的 Claude 被认为是处理编程任务的最佳模型,尤其是本月初发布的 Claude Opus 4.1,在真实世界编程、智能体以及推理任务上表现出色。 其中在软件编程权威基准 SWE-bench Verified 测试中,Claude Opus 4.1 相较于前代 Opus 4 又有提升,尤其在多文件代码重构方面表现出显著进步。 不过,在刚刚过去的这个周末,Claude 最强编程模型的地位似乎开始动摇了。
8/27/2025 11:35:00 AM
机器之心
首个接入GPT-5的视频Agent!一句话生成商业级广告大片,分镜配音字幕等全包了
AI视频生成,快速进入Agent时代! 只需一句提示词:生成一个F1赛车的现场解说视频。 AI即可自动完成分镜、画面、配音、字幕,生成结构完整、节奏在线的爆款视频。
8/25/2025 2:05:09 PM
GPT-5系统提示词突遭泄露,17803 token曝光OpenAI小心思!
新一版疑似GPT-5提示词,在GitHub上曝光了。 图片项目地址:(Tokenizer)中,提示词足足有17803 token,堪称「巨无霸」级别的指令。 图片这份文档出自Ásgeir Thor Johnson,他在Github上持续整理了几乎所有已经泄露的模型提示词。
8/25/2025 10:21:29 AM
新智元
比GPT-5还准?AIME25飙到99.9%刷屏,开源模型首次!
如何让模型在思考时更聪明、更高效,还能对答案有把握? 最近,Meta AI与加州大学圣地亚哥分校的研究团队给出了一个令人振奋的答案——Deep Think with Confidence(DeepConf),让模型自信的深度思考。 论文地址::「置信度筛选」,不仅让模型在国际顶尖数学竞赛AIME 2025上拿下了高达99.9%的正确率。
8/25/2025 8:53:00 AM
GPT-5点赞!八大顶尖机构发布「自进化智能体」全面综述
LLM驱动的AI智能体已展现出惊人潜力:它们以LLM为核心,集成感知模块(处理文本/图像/音频/视频)、规划模块(如链式思考CoT或树式思考ToT)、记忆模块(短期上下文存储与长期知识检索)和工具模块(调用API如搜索引擎或代码执行器)。 在单智能体系统中,这些组件协同工作,处理从网页导航、代码生成、投资辅助到生物医学分析的任务。 而在多智能体系统(MAS)中,智能体间通过协作(如辩论或任务分解)攻克复杂问题,模拟人类团队的群体智能。
8/21/2025 2:14:17 PM
新智元
GPT-5空间智能大考:简单任务称王,复杂挑战平手,所有模型都输给了人类
大家好,我是肆〇柒。 今天我们要探讨一篇由 DeepMind 联合 Stanford HAI(斯坦福以人为本人工智能研究院)共同发布的重磅实证研究报告。 这份报告首次对GPT-5的空间智能能力进行了系统性、标准化的全面评估,其结论可能会更加清晰我们对当前AI能力边界的认知。
8/21/2025 2:10:43 PM
肆零柒
刚刚,GPT-5 Pro自证全新数学定理!OpenAI总裁直呼颠覆,大佬们集体转发
AI真的能解决人类的前沿问题吗? 比如类似庞加莱猜想、求解麦克斯韦方程、费马大定理、黎曼猜想等问题。 今天这个问题有了答案。
8/21/2025 10:11:44 AM
奥特曼首曝GPT-6,亲口承认GPT-5「搞砸了」!接入大脑读心,估值或飙破5000亿
GPT-5还没捂热,奥特曼又来捧GPT-6了。 这几天,奥特曼在旧金山的采访中表示,「人们想要记忆功能,希望未来ChatGPT能让用户自定义语气和个性」。 虽未公布下一代AI模型的具体时间,但从奥特曼口中,可以感受出GPT-6确实不一样。
8/21/2025 9:05:00 AM
OpenAI豪赌5000亿美元估值神话:60亿股权大甩卖背后,GPT-5却遭用户冷遇
硅谷正在见证一场史无前例的估值狂欢。 OpenAI这个曾经的非营利组织,如今正准备通过一轮60亿美元的股权出售,将自己推向5000亿美元估值的云端——这个数字足以让它超越绝大多数上市公司,成为私营企业估值的新王者。 这场资本盛宴的背后,是OpenAI过去12个月里令人眩目的吸金能力。
8/20/2025 2:56:35 PM
AI在线
甲骨文深度集成 GPT-5,助力企业智能化转型
近期,甲骨文公司(Oracle)宣布将 OpenAI 的最新人工智能模型 GPT-5嵌入到其云服务和软件即服务(SaaS)应用中。 这一举措将生成式 AI 的能力扩展到企业的数据库、HR、财务和供应链工具,为企业客户提供了更加智能化的解决方案。 在8月18日的发布会上,甲骨文表示,GPT-5已在其数据库、Fusion Cloud 应用以及 NetSuite 等平台上全面上线。
8/20/2025 2:56:35 PM
AI在线
OpenAI高管自爆:Scaling不死,GPT-5「双轴训练」撕开智能天花板
GPT-5的能力到底有什么提升与意义? 人工智能未来走向何处? 这款惊艳亮相的OpenAI新模型,如何揭示智能的多种形态?
8/20/2025 12:22:31 PM
OpenAI再加速:奥尔特曼预告GPT-6即将到来,主打个性化与记忆功能
尽管GPT-5刚刚问世,但OpenAI首席执行官萨姆·奥尔特曼已在上周的媒体活动中透露了公司未来的雄心。 他明确表示,GPT-6已经在开发中,并且其发布间隔将比GPT-4和GPT-5之间更短。 奥尔特曼强调,GPT-6的核心突破在于记忆和个性化,这将是实现真正个性化聊天体验的关键。
8/20/2025 10:06:01 AM
AI在线
GPT-5暴写「屎山代码」!14个Prompt,看穿GPT-1到GPT-5七年智商进化史
一张基准对比图,彻底火遍了全网。 GPT-5发布近半个月,实际表现未达预期,不少人感慨:苦等OpenAI两年,就是这? 为此,Peter Gostev将GPT-4和GPT-5在数学、软件工程、问答等基准上,做了一个直观对比。
8/19/2025 4:05:27 PM
GPT-5翻车实录:被寄予厚望的AI新王者,为何不如Claude?
昨天在Twitter上,一位开发者@Teknium1发了一条推文:"在多次尝试中,GPT-5(包括gpt-5-thinking-high max)表现不佳,不如Opus甚至Sonnet。 "这条推文迅速引爆了AI圈,成千上万的开发者开始分享自己的"翻车"经历。 作为一个从GPT-3时代就开始使用OpenAI产品的人,我对这次GPT-5的发布抱有极高期待。
8/19/2025 9:56:03 AM
阿丸笔记
OpenAI总裁透露GPT-5改了推理范式,AGI实现要靠现实反馈
OpenAI的AGI之路,总裁Greg Brockman在最新的访谈中说清楚了——技术层面,从文本生成转向强化学习的推理范式,在现实世界中试错并获取反馈;资源策略上,持续投入大规模计算资源;落地环节,把模型封装成Agent,将模型能力打包成为可审计的服务进程。 图片这场访谈由AI播客Latent Space主持,与Brockman探讨了OpenAI的AGI的整体技术路线与资源策略。 与此同时,OpenAI的落地布局,以及Brockman对未来的思考,也都随着访谈的进行浮出水面。
8/18/2025 5:14:41 PM
量子位
资讯热榜
标签云
AI
人工智能
OpenAI
AIGC
模型
ChatGPT
谷歌
DeepSeek
AI绘画
大模型
机器人
数据
AI新词
Midjourney
开源
Meta
微软
智能
用户
GPT
学习
智能体
技术
Gemini
马斯克
英伟达
Anthropic
图像
AI创作
训练
LLM
论文
代码
算法
苹果
AI for Science
Agent
Claude
腾讯
芯片
Stable Diffusion
蛋白质
具身智能
开发者
xAI
生成式
神经网络
机器学习
人形机器人
3D
AI视频
RAG
大语言模型
Sora
研究
百度
生成
GPU
工具
华为
字节跳动
计算
AGI
大型语言模型
AI设计
搜索
生成式AI
视频生成
DeepMind
特斯拉
场景
AI模型
深度学习
亚马逊
架构
Transformer
MCP
Copilot
编程
视觉