GPT-5
GPT-5惨遭零分打脸,顶级AI全军覆没!奥特曼AI博士级能力神话破灭
奥特曼在GPT-5的发布会上曾说过一个结论。 「以后每个人的兜里都有一个博士级AI随时随地的提供建议」。 GPT-5的发布后也被全球的疯狂实测,API使用量暴增。
9/16/2025 9:13:00 AM
GPT-5是口袋博士?诺奖得主哈萨比斯怒怼奥特曼:博士级AI纯属扯淡!
目前的博士级人工智能就是扯淡! 实属没想到,诺奖得主、谷歌DeepMind CEO哈萨比斯(Demis Hassabis)竟公然怒怼奥特曼。 在最近的访谈中,哈萨比斯公开表示,把如今的LLM称作「博士级智能」,纯属无稽之谈!
9/15/2025 9:13:00 AM
文心X1.1事实性暴涨35%25!国产AI首次正面硬刚GPT-5
有朋友问我,最近AI圈有没有什么重磅消息。 我想了想,可能是百度刚发布的文心X1.1,这个模型有点不一样。 说实话,国产AI模型这几年虽然发展很快,但在核心能力上要说能正面挑战GPT这样的国际顶级模型,我一直持保留态度。
9/12/2025 9:21:58 AM
阿丸笔记
真·博士水平!GPT-5首次给出第四矩定理显式收敛率,数学教授只点拨了一下
GPT-5真不愧是博士水平的AI! 在数学教授引导下,它首次将定性的第四矩定理扩展为带有显式收敛率的定量形式。 简单来讲就是,原来的定理仅说明收敛会发生,却没有给出具体速度,而借助GPT-5,这项研究首次明确了收敛速率。
9/10/2025 6:00:58 PM
OpenAI 携手推出首部 AI 动画电影《Critterz》,2026 年全球上映
OpenAI 宣布支持制作首部由人工智能创作的动画电影《Critterz》。 这部影片计划于 2026 年全球上映,目标是在戛纳电影节首映。 《Critterz》的故事围绕着一群生活在宁静村庄的森林生物,他们的日常生活因一位神秘的外来者而被打破。
9/9/2025 3:42:15 PM
AI在线
GPT-5爆改时尚圈,让Excel原地复活!OpenAI黑客松大奖出炉
OpenAI刚发布GPT-5,便在旧金山举办了GPT-5黑客马拉松挑战赛。 这场比赛选择在周末,从8月9日上午10点开始,到8月9日下午5点结束。 OpenAI邀请了500多位黑客来到旧金山,挑战GPT-5的极限,共有95支队伍参赛,角逐5万美元奖金。
9/9/2025 9:16:00 AM
谁不用谁亏!Karpathy吹爆GPT-5:10分钟编码完胜Claude一小时,奥特曼秒回感谢
GPT-5 Pro再次得到了AI大佬的认可。 今天,Karpathy一早激动发文,「必须再吹一波OpenAI的GPT-5 Pro,真的太强了」! 这究竟是肿么回事儿?
9/8/2025 8:53:00 AM
GPT-5变身超级行政助理:纳德拉分享其在 Copilot 中的日常领导力用法
微软首席执行官萨蒂亚·纳德拉 (Satya Nadella) 近日罕见地透露了他个人如何将 GPT-5和 Microsoft Copilot 融入其日常工作,将其作为核心的领导力工具。 在8月28日于领英 (LinkedIn) 发布的一篇动态中,纳德拉分享了五个由人工智能驱动的具体提示,并声称这些工具正在重塑他的时间管理、战略决策方式,并显著提高了高管的生产力。 “我们将 GPT-5引入 Microsoft365Copilot 已经几周了,它很快就成为了我日常工作流程的一部分,” 纳德拉写道,“它为我的所有应用程序增加了一层新的智能。
9/5/2025 10:17:07 AM
AI在线
GPT-5又帮陶哲轩解决了一个难题
GPT-5又帮陶哲轩解决了一个难题! 消息来自陶本人最新动态,他衷心提醒大家:AI能够大显身手的场景再 1——半自动化文献检索。 简单来说,陶正在做的事情,其实就是用AI 数据库比对来帮忙解决数学里的难题。
9/4/2025 9:04:13 AM
7个AI玩狼人杀,GPT-5获断崖式MVP,Kimi手段激进
不圆 发自 凹非寺. 量子位 | 公众号 QbitAI一群AI玩狼人杀,GPT-5断崖式领先,胜率达到了惊人的96.7%。 OpenAI的总裁格雷格·布罗克曼转发了这样的一个基准测试:让7个强大的LLMs,包括开源和闭源,玩了210场完整的狼人杀。
9/2/2025 5:25:28 PM
不圆
GPT-5“变笨”实锤,退休教授出了道井字棋送分题,结果它真送了
西风 发自 凹非寺. 量子位 | 公众号 QbitAI退休经济学教授用一个简单问题干懵GPT-5,其拉胯表现与奥特曼口中“博士级AI”的宣传大相径庭。 问题很简单,关于咱小时候都玩过的“井”字棋游戏。
9/1/2025 3:54:17 PM
西风
GPT-5冷酷操盘,狼人杀一战封神!七大LLM狂飙演技,人类玩家看完沉默
一群模型去玩狼人杀,谁能夺下冠军? 这不,GPT-5、Gemini 2.5 Pro、Qwen3-235B-Instruct、GPT-OSS-120B等七大顶尖模型组队,同擂台开战。 一共210场血战,最终,GPT-5以96.7%的胜率独占榜首。
9/1/2025 9:03:00 AM
被低估的GPT-5!OpenAI给7亿人解锁最强AI,大众智能一夜撕裂旧秩序
直到现在,GPT-5的升级,仍然被很多人低估了! 一方面是,很多人没有看透OpenAI发布GPT-5背后的真正原因。 GPT-5的「突破」不在性能,而是模型「自带路由」和思考配额分发下的「单位token经济学」。
9/1/2025 2:55:00 AM
新智元
「开发者私下更喜欢用GPT-5写代码」,Claude还坐得稳编程王座吗?
一直以来,Anthropic 的 Claude 被认为是处理编程任务的最佳模型,尤其是本月初发布的 Claude Opus 4.1,在真实世界编程、智能体以及推理任务上表现出色。 其中在软件编程权威基准 SWE-bench Verified 测试中,Claude Opus 4.1 相较于前代 Opus 4 又有提升,尤其在多文件代码重构方面表现出显著进步。 不过,在刚刚过去的这个周末,Claude 最强编程模型的地位似乎开始动摇了。
8/27/2025 11:35:00 AM
机器之心
首个接入GPT-5的视频Agent!一句话生成商业级广告大片,分镜配音字幕等全包了
AI视频生成,快速进入Agent时代! 只需一句提示词:生成一个F1赛车的现场解说视频。 AI即可自动完成分镜、画面、配音、字幕,生成结构完整、节奏在线的爆款视频。
8/25/2025 2:05:09 PM
GPT-5系统提示词突遭泄露,17803 token曝光OpenAI小心思!
新一版疑似GPT-5提示词,在GitHub上曝光了。 图片项目地址:(Tokenizer)中,提示词足足有17803 token,堪称「巨无霸」级别的指令。 图片这份文档出自Ásgeir Thor Johnson,他在Github上持续整理了几乎所有已经泄露的模型提示词。
8/25/2025 10:21:29 AM
新智元
比GPT-5还准?AIME25飙到99.9%刷屏,开源模型首次!
如何让模型在思考时更聪明、更高效,还能对答案有把握? 最近,Meta AI与加州大学圣地亚哥分校的研究团队给出了一个令人振奋的答案——Deep Think with Confidence(DeepConf),让模型自信的深度思考。 论文地址::「置信度筛选」,不仅让模型在国际顶尖数学竞赛AIME 2025上拿下了高达99.9%的正确率。
8/25/2025 8:53:00 AM
GPT-5点赞!八大顶尖机构发布「自进化智能体」全面综述
LLM驱动的AI智能体已展现出惊人潜力:它们以LLM为核心,集成感知模块(处理文本/图像/音频/视频)、规划模块(如链式思考CoT或树式思考ToT)、记忆模块(短期上下文存储与长期知识检索)和工具模块(调用API如搜索引擎或代码执行器)。 在单智能体系统中,这些组件协同工作,处理从网页导航、代码生成、投资辅助到生物医学分析的任务。 而在多智能体系统(MAS)中,智能体间通过协作(如辩论或任务分解)攻克复杂问题,模拟人类团队的群体智能。
8/21/2025 2:14:17 PM
新智元
资讯热榜
标签云
AI
人工智能
OpenAI
AIGC
模型
ChatGPT
DeepSeek
AI绘画
谷歌
机器人
数据
大模型
Midjourney
开源
智能
Meta
用户
微软
GPT
学习
技术
图像
Gemini
智能体
马斯克
AI新词
AI创作
Anthropic
英伟达
论文
训练
代码
算法
LLM
Stable Diffusion
芯片
腾讯
苹果
蛋白质
Claude
开发者
AI for Science
Agent
生成式
神经网络
机器学习
3D
xAI
研究
人形机器人
生成
AI视频
百度
计算
工具
Sora
GPU
大语言模型
华为
RAG
AI设计
字节跳动
具身智能
搜索
大型语言模型
场景
深度学习
AGI
视频生成
预测
视觉
伟达
架构
Transformer
神器推荐
DeepMind
亚马逊
特斯拉
编程
AI模型