OpenAI
GPT-5编程成绩有猫腻!自删23道测试题,关键基准还是自己提的
别急着用GPT-5编程了,可能它能力没有你想象中那么强。 有人发现,官方测试编程能力用的SWE-bench Verified,但货不对板,只用了477个问题。 什么意思呢?
8/13/2025 8:50:00 AM
刚刚,OpenAI拿下IOI金牌,仅次于前五名人类选手!参赛推理模型才夺得IMO金牌
一觉醒来,OpenAI 的大模型又完成了一项壮举! 在全球顶级编程赛事之一 ——2025 年国际信息学奥林匹克(IOI)中,OpenAI 的推理模型取得了足以摘得金牌的高分,并在 AI 参赛者中排名第一! IOI 2025(即第 37 届国际信息学奥林匹克)在玻利维亚的苏克雷举行,7 月 27 日正式开幕,并已于 8 月 3 日落下了帷幕。
8/12/2025 10:51:00 AM
机器之心
刚刚,OpenAI内部推理模型斩获IOI 2025金牌!所有AI选手中第一
刚刚,OpenAI内部推理模型在获得IMO金牌后,又拿下了IOI金牌。 图片和上次IMO一样,OpenAI 使用了草莓形象来代表这个推理模型。 只不过这次的「草莓」不仅带上了IOI的金牌,而且更加的拟人,这个形象很有可能进化为OpenAI内部推理系统代表形象。
8/12/2025 9:46:18 AM
新智元
OpenAI夺金IOI,但输给3位中国高中生
西风 发自 凹非寺. 量子位 | 公众号 QbitAI刚刚,OpenAI官宣:IOI金牌收入囊中! 其推理模型在今年IOI线上竞赛中成绩刷新纪录:.
8/12/2025 9:29:16 AM
西风
2025 年多款 Deep Research 智能体框架全面对比
作者:fangzlong随着模型的范式和工程方式发展,网络上涌现出了一大批模仿人类研究者对问题进行深入研究的智能体应用。 本文将从 OpenAI 关于 DeepResearch 的指南开始,通过几个开源框架的架构解构与功能映射,揭示不同框架在研究自动化领域的差异。 为各位使用者、开发者选择合适工具和框架提供系统化参考。
8/12/2025 8:58:03 AM
腾讯技术工程
OpenAI开放AI模型库 但CIO们需警惕潜在风险
开源模型为企业IT提供了一种方法,可基于企业内容构建定制化的大语言模型,目前,OpenAI正推出两款开源模型。 ChatGPT的开发者OpenAI已根据Apache 2.0开源许可证发布了两款大语言模型,这两款模型gpt-oss-120b和gpt-oss-20b均为开放权重语言模型,OpenAI称其能以低成本提供强大的现实性能。 据OpenAI介绍,新模型在推理任务上的表现优于同类规模的开源模型,且针对在消费级硬件上的高效部署进行了优化。
8/11/2025 6:01:57 PM
Cliff Saran
OpenAI重新启用旧版模型 奥特曼坦承GPT-5上线过程"坎坷"
OpenAI联合创始人兼CEO奥特曼公开承认,公司最新旗舰级大型语言模型GPT-5在发布时出现了重大问题。 尽管该模型被宣传为迄今为止功能最强大的一款,但发布过程并不顺利。 奥特曼在Reddit的“问我任何问题”(AMA)板块和X平台上回答用户提问时,承认了GPT-5发布过程中出现的一系列问题,包括模型切换故障、性能不佳以及用户困惑等,这些问题促使OpenAI部分撤销了一些平台变更,并恢复了用户对GPT-4o等早期模型的访问权限。
8/11/2025 2:13:36 PM
Carl Franzen
GPT-5发布即翻车!奥特曼深夜承认:图表出错,模型变笨。用户只想用回GPT-4o
OpenAI在8月7日正式推出新一代旗舰大模型GPT-5。 据说,这是该公司自成立以来最受关注的一次产品迭代,被宣称是“最强大、最智能”的语言模型,能够在推理、创意生成和多模态理解等多个方面实现质的飞跃。 然而,就在发布后的不到24小时内,OpenAI首席执行官山姆·奥特曼就不得不面对现实。
8/11/2025 2:11:00 AM
OpenAI重磅发布ChatGPT-5!写作坠入谷底,编程一骑绝尘
凌晨 1 点,在万众瞩目的境况下,OpenAI 的直播正式开始。 GPT-5,终于来了。 AI 走的太快,快到才 2 年半的时间,就像是过去了 10 年。
8/11/2025 12:25:16 AM
数字生命卡兹克
GPT-5问题太多,奥特曼带团回应一切,图表弄错是因「太累了」
前期有多期望,后期就有多失望,这大概是大多数业界人士在看到 GPT-5 这场事先张扬的高调发布后的最大心声。 当然,也许在内部测试的时候,OpenAI 确实觉得 GPT-5 是目前最为强大的模型,可是走进真实世界后却好像并非如此。 一位 X 网友发现 GPT-5 在解决可能属于小学水平的数学题时无能为力,吐槽到底被官方称为「博士」水平的智力是哪个学校颁发的?
8/9/2025 11:23:00 PM
机器之心
“还我GPT-4o”!奥特曼强推GPT-5惹怒网友,紧急公关来了
千呼万唤始出来的GPT-5上线后,却遇冷了…. 特别是OpenAI一刀切替换所有模型后,GPT-4o反而被网友们纷纷招魂。 原因无他,GPT-5太人机。
8/9/2025 4:50:51 PM
鹭羽
用户痛批GPT-5,哭诉「还我GPT-4o」,奥特曼妥协了
等了好久,终于等到 GPT-5。 但大家似乎对这个模型并不满意。 可以使用 GPT-5 的小伙伴,现在打开页面,是这样的。
8/9/2025 12:44:00 PM
机器之心
GPT-5真的拉胯吗?机器之心一手实测,网友:还我4o、还我4.5
一觉醒来,朋友圈被 GPT-5 刷了屏。 在昨晚长达一个多小时的发布直播中,OpenAI 介绍了 GPT-5 的性能,演示了诸多实用案例,在此不赘述,感兴趣的朋友可以移步:刚刚,奥特曼发布 GPT-5! 人人免费用「博士级」智能,基准图错误遭全网吐槽。
8/8/2025 4:50:00 PM
机器之心
GPT-5将如何重塑IT团队、开发者与职场AI的未来
OpenAI发布了其大型语言模型的最新版本GPT-5,目前,开发人员和ChatGPT用户已可使用该版本,它为AI在商业和IT环境中的应用带来了一些实质性变革。 与之前的版本不同,GPT-5在后台采用了一种新方法,它不再让用户根据速度或准确度来选择不同的模型,而是能即时决定如何响应,如果任务简单,它会快速响应,如果任务更复杂,它会切换到更深入的推理引擎,用户还可以提示它“逐步思考”,以触发更周全的回答。 GPT-5的另一个重大变化是其安全处理方式,旧版本常常直接拒绝回答某些问题,而GPT-5则采用了不同的方法,它不会中断对话,而是尝试在遵守安全规则的同时,结合上下文进行回应。
8/8/2025 2:06:52 PM
Sinisa
刚刚,奥特曼发布GPT-5!人人免费用「博士级」智能,基准图错误遭全网吐槽
都看了吗? 等了多年的 GPT-5,终于在这个凌晨发布了。 我们一脸的期待,直播中 OpenAI 几位核心人员的紧张也肉眼可见。
8/8/2025 7:15:00 AM
机器之心
云计算一哥首度牵手OpenAI,大模型「选择」自由,才是终极胜利
昨天是个热闹的日子,OpenAI 和 Anthropic 几乎在同一时间发布了自家的新款模型:前者是自 GPT-2 以来重新开源的两款模型 gpt-oss(120b 和 20b),后者是 Claude 系列最强的 Opus 4.1。 模型刚发布没多久,当大家还没从 OpenAI 和 Anthropic 两家的新模型遭遇战中缓过劲来的时候,云计算一哥大手一挥:「我全都要! 」亚马逊云科技重磅宣布,首次通过 Amazon Bedrock 和 Amazon SageMaker AI 两大平台实现对 OpenAI 新开源模型的支持。
8/7/2025 10:03:00 PM
机器之心
OpenAI重磅发布gpt-oss系列开源大模型:媲美 GPT-4o
不论你是独立开发者、企业还是研究机构,现在都可以免费拥有一款与 GPT-4o 接近实力的语言模型。 开源但不“阉割”:媲美 GPT-4o,运行成本极低OpenAI 在这次发布中非常有诚意:gpt-oss-120b:在核心推理任务上已接近 GPT-4o-mini,支持 128k 上下文,单卡 80GB GPU 可跑。 gpt-oss-20b:性能对标 GPT-3.5(o3-mini),仅需 16GB 显存,可部署于消费级设备、本地推理、离线使用等场景。
8/7/2025 2:05:40 PM
AI大模型应用开发
奥特曼出新招防挖角!员工期权变钞票,按5000亿美元估值兑现
被挖怕了! 保密员工名字还不够,奥特曼为“防挖”又出新招——. 开启新一期员工期权兑现计划,按照5000亿美元的估值来兑现。
8/7/2025 12:52:48 PM
闻乐
资讯热榜
全新开源的DeepSeek-OCR,可能是最近最惊喜的模型!
AI 模型“炒股”比拼!DeepSeek 收益超14%,Gemini2.5Pro 惨亏四成
具身智能学界业界思想「惊人的统一」?美团在IROS开了个学术年会
OpenAI强化Sora 2保护政策,确保艺人声音与肖像权不被侵犯
刚刚,ChatGPT终于可以走遍整个互联网了!OpenAI深夜炸街:原生ChatGPT集成、即时理解、主动执行,浏览器赛道鲨疯了
OpenAI首款ChatGPT浏览器发布!现在就能免费下载使用
告别抽卡!Vidu Q2多图参考生视频功能重磅上线
Andrej Karpathy评DeepSeek-OCR论文:图像输入可能成为大语言模型新方向
标签云
AI
人工智能
OpenAI
AIGC
模型
ChatGPT
DeepSeek
谷歌
AI绘画
机器人
数据
大模型
Midjourney
开源
Meta
智能
微软
用户
AI新词
GPT
学习
技术
智能体
马斯克
Gemini
图像
Anthropic
英伟达
AI创作
训练
LLM
论文
代码
算法
芯片
腾讯
AI for Science
Stable Diffusion
苹果
Agent
Claude
蛋白质
开发者
生成式
神经网络
xAI
机器学习
3D
人形机器人
研究
AI视频
生成
RAG
大语言模型
百度
具身智能
Sora
工具
GPU
华为
计算
字节跳动
AI设计
搜索
大型语言模型
AGI
视频生成
场景
深度学习
DeepMind
架构
视觉
生成式AI
预测
Transformer
编程
AI模型
伟达
特斯拉
Copilot