AI在线 AI在线

GPT-5

GPT-5惨遭零分打脸,顶级AI全军覆没!奥特曼AI博士级能力神话破灭

奥特曼在GPT-5的发布会上曾说过一个结论。 「以后每个人的兜里都有一个博士级AI随时随地的提供建议」。 GPT-5的发布后也被全球的疯狂实测,API使用量暴增。
9/16/2025 9:13:00 AM

GPT-5是口袋博士?诺奖得主哈萨比斯怒怼奥特曼:博士级AI纯属扯淡!

目前的博士级人工智能就是扯淡! 实属没想到,诺奖得主、谷歌DeepMind CEO哈萨比斯(Demis Hassabis)竟公然怒怼奥特曼。 在最近的访谈中,哈萨比斯公开表示,把如今的LLM称作「博士级智能」,纯属无稽之谈!
9/15/2025 9:13:00 AM

文心X1.1事实性暴涨35%25!国产AI首次正面硬刚GPT-5

有朋友问我,最近AI圈有没有什么重磅消息。 我想了想,可能是百度刚发布的文心X1.1,这个模型有点不一样。 说实话,国产AI模型这几年虽然发展很快,但在核心能力上要说能正面挑战GPT这样的国际顶级模型,我一直持保留态度。
9/12/2025 9:21:58 AM
阿丸笔记

真·博士水平!GPT-5首次给出第四矩定理显式收敛率,数学教授只点拨了一下

GPT-5真不愧是博士水平的AI! 在数学教授引导下,它首次将定性的第四矩定理扩展为带有显式收敛率的定量形式。 简单来讲就是,原来的定理仅说明收敛会发生,却没有给出具体速度,而借助GPT-5,这项研究首次明确了收敛速率。
9/10/2025 6:00:58 PM

OpenAI 携手推出首部 AI 动画电影《Critterz》,2026 年全球上映

OpenAI 宣布支持制作首部由人工智能创作的动画电影《Critterz》。 这部影片计划于 2026 年全球上映,目标是在戛纳电影节首映。 《Critterz》的故事围绕着一群生活在宁静村庄的森林生物,他们的日常生活因一位神秘的外来者而被打破。
9/9/2025 3:42:15 PM
AI在线

GPT-5爆改时尚圈,让Excel原地复活!OpenAI黑客松大奖出炉

OpenAI刚发布GPT-5,便在旧金山举办了GPT-5黑客马拉松挑战赛。 这场比赛选择在周末,从8月9日上午10点开始,到8月9日下午5点结束。 OpenAI邀请了500多位黑客来到旧金山,挑战GPT-5的极限,共有95支队伍参赛,角逐5万美元奖金。
9/9/2025 9:16:00 AM

谁不用谁亏!Karpathy吹爆GPT-5:10分钟编码完胜Claude一小时,奥特曼秒回感谢

GPT-5 Pro再次得到了AI大佬的认可。 今天,Karpathy一早激动发文,「必须再吹一波OpenAI的GPT-5 Pro,真的太强了」! 这究竟是肿么回事儿?
9/8/2025 8:53:00 AM

GPT-5变身超级行政助理:纳德拉分享其在 Copilot 中的日常领导力用法

微软首席执行官萨蒂亚·纳德拉 (Satya Nadella) 近日罕见地透露了他个人如何将 GPT-5和 Microsoft Copilot 融入其日常工作,将其作为核心的领导力工具。 在8月28日于领英 (LinkedIn) 发布的一篇动态中,纳德拉分享了五个由人工智能驱动的具体提示,并声称这些工具正在重塑他的时间管理、战略决策方式,并显著提高了高管的生产力。 “我们将 GPT-5引入 Microsoft365Copilot 已经几周了,它很快就成为了我日常工作流程的一部分,” 纳德拉写道,“它为我的所有应用程序增加了一层新的智能。
9/5/2025 10:17:07 AM
AI在线

GPT-5又帮陶哲轩解决了一个难题

GPT-5又帮陶哲轩解决了一个难题! 消息来自陶本人最新动态,他衷心提醒大家:AI能够大显身手的场景再 1——半自动化文献检索。 简单来说,陶正在做的事情,其实就是用AI 数据库比对来帮忙解决数学里的难题。
9/4/2025 9:04:13 AM

7个AI玩狼人杀,GPT-5获断崖式MVP,Kimi手段激进

不圆 发自 凹非寺. 量子位 | 公众号 QbitAI一群AI玩狼人杀,GPT-5断崖式领先,胜率达到了惊人的96.7%。 OpenAI的总裁格雷格·布罗克曼转发了这样的一个基准测试:让7个强大的LLMs,包括开源和闭源,玩了210场完整的狼人杀。
9/2/2025 5:25:28 PM
不圆

GPT-5“变笨”实锤,退休教授出了道井字棋送分题,结果它真送了

西风 发自 凹非寺. 量子位 | 公众号 QbitAI退休经济学教授用一个简单问题干懵GPT-5,其拉胯表现与奥特曼口中“博士级AI”的宣传大相径庭。 问题很简单,关于咱小时候都玩过的“井”字棋游戏。
9/1/2025 3:54:17 PM
西风

GPT-5冷酷操盘,狼人杀一战封神!七大LLM狂飙演技,人类玩家看完沉默

一群模型去玩狼人杀,谁能夺下冠军? 这不,GPT-5、Gemini 2.5 Pro、Qwen3-235B-Instruct、GPT-OSS-120B等七大顶尖模型组队,同擂台开战。 一共210场血战,最终,GPT-5以96.7%的胜率独占榜首。
9/1/2025 9:03:00 AM

被低估的GPT-5!OpenAI给7亿人解锁最强AI,大众智能一夜撕裂旧秩序

直到现在,GPT-5的升级,仍然被很多人低估了! 一方面是,很多人没有看透OpenAI发布GPT-5背后的真正原因。 GPT-5的「突破」不在性能,而是模型「自带路由」和思考配额分发下的「单位token经济学」。
9/1/2025 2:55:00 AM
新智元

「开发者私下更喜欢用GPT-5写代码」,Claude还坐得稳编程王座吗?

一直以来,Anthropic 的 Claude 被认为是处理编程任务的最佳模型,尤其是本月初发布的 Claude Opus 4.1,在真实世界编程、智能体以及推理任务上表现出色。 其中在软件编程权威基准 SWE-bench Verified 测试中,Claude Opus 4.1 相较于前代 Opus 4 又有提升,尤其在多文件代码重构方面表现出显著进步。 不过,在刚刚过去的这个周末,Claude 最强编程模型的地位似乎开始动摇了。
8/27/2025 11:35:00 AM
机器之心

首个接入GPT-5的视频Agent!一句话生成商业级广告大片,分镜配音字幕等全包了

AI视频生成,快速进入Agent时代! 只需一句提示词:生成一个F1赛车的现场解说视频。 AI即可自动完成分镜、画面、配音、字幕,生成结构完整、节奏在线的爆款视频。
8/25/2025 2:05:09 PM

GPT-5系统提示词突遭泄露,17803 token曝光OpenAI小心思!

新一版疑似GPT-5提示词,在GitHub上曝光了。 图片项目地址:(Tokenizer)中,提示词足足有17803 token,堪称「巨无霸」级别的指令。 图片这份文档出自Ásgeir Thor Johnson,他在Github上持续整理了几乎所有已经泄露的模型提示词。
8/25/2025 10:21:29 AM
新智元

比GPT-5还准?AIME25飙到99.9%刷屏,开源模型首次!

如何让模型在思考时更聪明、更高效,还能对答案有把握? 最近,Meta AI与加州大学圣地亚哥分校的研究团队给出了一个令人振奋的答案——Deep Think with Confidence(DeepConf),让模型自信的深度思考。 论文地址::「置信度筛选」,不仅让模型在国际顶尖数学竞赛AIME 2025上拿下了高达99.9%的正确率。
8/25/2025 8:53:00 AM

GPT-5点赞!八大顶尖机构发布「自进化智能体」全面综述

LLM驱动的AI智能体已展现出惊人潜力:它们以LLM为核心,集成感知模块(处理文本/图像/音频/视频)、规划模块(如链式思考CoT或树式思考ToT)、记忆模块(短期上下文存储与长期知识检索)和工具模块(调用API如搜索引擎或代码执行器)。 在单智能体系统中,这些组件协同工作,处理从网页导航、代码生成、投资辅助到生物医学分析的任务。 而在多智能体系统(MAS)中,智能体间通过协作(如辩论或任务分解)攻克复杂问题,模拟人类团队的群体智能。
8/21/2025 2:14:17 PM
新智元