GPT-5

ChatGPT 每周处理200万保险难题，医疗查询占比超5%

据 AIbase 报道，OpenAI 近期向 Axios 提供的一份独家报告揭示了一个惊人的趋势:健康医疗已成为 ChatGPT 最核心的使用场景之一。全球范围内超过5% 的查询与健康相关，而在美国，每天有约4000万人向这款 AI 寻求医疗建议。从解析晦涩的医疗账单、对比保险方案到初步检查病症，ChatGPT 正在成为许多无法立即预约医生的美国人眼中的“医疗盟友”。

1/6/2026 2:16:19 PM AI在线

GPT-5 首次独立攻克数学难题，透明化归因实验引发学界争论

瑞士数学家约翰内斯·施密特（Johannes Schmitt）近期在 X 上发布了一项足以载入史册的研究成果:GPT-5在没有任何人类干预或提示引导的情况下，首次独立解决了一个长期未解的数学难题。施密特评价称，GPT-5的解决方案展现了令人惊叹的创造力，它并未遵循该领域的常规逻辑，而是跨界借鉴了代数几何其他分支的技术手段。这一突破不仅印证了数学大师陶哲轩此前对 AI 潜力的预判，更将科学界推向了一个必须直面“AI 独立贡献”的新阶段。

12/23/2025 9:57:10 AM AI在线

OpenAI计算利润率飙升至70%！内部指标翻倍，商业化效率显著提升

在巨额投入与高调扩张的表象之下，OpenAI正悄然实现商业化效率的惊人跃升。据多位知情人士透露，截至 2025 年 10 月，OpenAI内部关键指标——“计算利润率”（Compute Profit Margin）已攀升至70%，较 2024 年底的52%大幅提升，更是 2024 年 1 月水平的两倍。这一数据虽未获官方正式确认（OpenAI发言人回应称“不披露该指标”），却释放出强烈信号：这家曾以“烧钱”著称的AI巨头，正加速从技术先锋向高效率盈利引擎转型。

12/22/2025 12:21:27 PM AI在线

OpenAI拟融资千亿美元，估值或冲8300亿——AI军备竞赛进入“万亿美元前夜”

OpenAI正谋划一场史无前例的融资行动，试图为其雄心勃勃的AI帝国铺就资金基石。据知情人士透露，该公司计划筹集最多 1000 亿美元，若按此上限全额完成，其估值将飙升至 8300 亿美元——这一数字不仅远超多数科技巨头，更逼近全球市值最高企业的门槛。据悉，此轮融资目前仍处于早期阶段，目标是在 2025 年第一季度末前完成。

12/19/2025 10:31:00 AM AI在线

AI 科学研究新基准:FrontierScience 评估模型推理能力

在科学研究中，推理能力至关重要。科学家们不仅仅是回忆事实，还需提出假设、测试并修正这些假设，并在不同领域之间综合思想。随着 AI 模型能力的提升，如何评估它们在科学研究中深度推理的能力成为了一个重要问题。

12/17/2025 4:47:16 PM AI在线

GPT-5展现惊人数学能力，助研究者节省一个月的工作时间

12/1/2025 10:46:41 AM AI在线

AI 离诺奖有多远?顶级模型在博士级物理基准测试“CritPt”中惨败，准确率不足10%

据 AIbase 报道，一项名为“CritPt”的全新物理基准测试结果显示，即使是目前最顶尖的人工智能模型，如 Gemini3Pro 和 GPT-5，距离成为真正的自主科学家仍有巨大的差距。该基准测试旨在将领先的 AI 模型置于博士早期研究水平进行严苛考核。 CritPt:检验 AI 的科研实战能力“CritPt”由来自全球30多个机构的50多位物理学家共同构建。

11/24/2025 11:06:33 AM AI在线

领先 AI 模型在复杂物理任务中表现不佳，仍需人类助力

近日，由全球超过50位物理学家联合开发的 “CritPt” 基准测试，旨在评估顶尖 AI 模型在处理未公开的复杂物理研究问题时的能力。测试的目标是模拟早期博士研究生所需的独立研究水平。尽管目前的 AI 系统如谷歌的 “Gemini3Pro” 和 OpenAI 的 “GPT-5” 被寄予厚望，但结果却令人失望。

11/24/2025 11:06:08 AM AI在线

OpenAI 发布新 GPT-5 模型，加速数学与科学研究

11/21/2025 11:51:06 AM AI在线

LMArena公布最新大模型排名：Claude、GPT-5与智谱GLM-4.6并列第一

近日，全球知名的 AI 模型评测平台 LMArena 公布了最新的 AI 大模型排名，令人瞩目的是，美国的 Anthropic 公司推出的 Claude、OpenAI 的 GPT-5 以及智谱科技的 GLM-4.6，这三款 AI 编程模型在排行榜上不分上下，齐齐占据了全球第一的位置。这些模型专为编程任务而设计，旨在帮助开发者更加高效地进行代码编写、调试和优化。随着科技的不断进步，AI 编程模型的出现不仅提升了软件开发的效率，也为各类开发者提供了强大的工具支持。

11/13/2025 4:57:07 PM AI在线

刚刚，GPT-5.1发布，OpenAI开始拼情商

深夜，GPT-5 系列迎来大更新：上线 GPT-5.1 Instant 以及 GPT-5.1 Thinking 模型：GPT-5.1 Instant：ChatGPT 最常用的模型，更温暖、更智能，也更善于遵循指令的模型。 GPT-5.1 Thinking：高级推理模型，在简单任务上更快，在复杂任务上更持久，也更容易理解。对于新上线的模型，OpenAI 表示出色的 AI 不仅要聪明，还要让人与之对话变得愉悦。

11/13/2025 10:47:00 AM 机器之心

OpenAI深陷90亿美元现金流危机！技术光环难掩财务隐忧，Anthropic已悄然领跑盈利赛道

11/11/2025 1:21:47 PM AI在线

大模型AI扫地机器人 “翻车”：成功率仅 40%！家庭应用仍有待提高

最近，AI 实验室 Andon Labs 进行了一项引人注目的研究，专门评估了搭载顶级大模型的扫地机器人在完成简单家务任务时的表现。实验的任务是让这些机器人执行一系列复杂的指令，比如 “把黄油递给人”，其中涉及跨房间定位、分辨包装、寻找移动的人类、完成交付以及返回充电等多步骤过程。然而，结果让人震惊。

11/3/2025 8:51:19 AM AI在线

DeepMind一篇论文终结十年之争！GPT-5推理靠世界模型

GPT-5上线后，最让人震惊的不是它能写诗画画，而是它展现出的推理能力。网友惊呼：「感觉像是在和博士讨论问题」，媒体更是直言它的逻辑水平已经「堪比专家」。为什么会出现这种「突然开窍」的效果？

10/31/2025 4:04:17 PM 新智元

颤抖吧，Bug！OpenAI放出GPT-5「夜行神兽」，命中92%漏洞

刚刚，OpenAI推出了使用GPT-5寻找和修复安全漏洞的智能体Aardvark。目前，Aardvark还处于beta测试阶段。 OpenAI称，Aardvark开创了「防御者优先」的新范式：作为自主安全研究智能体，随代码不断演化，为团队提供持续保护（continuous protection）。

10/31/2025 3:53:06 PM

OpenAI“Company Knowledge”上线可以连接企业知识和数据源

OpenAI正式推出ChatGPT的“Company Knowledge”功能，这一创新直接响应了企业用户对数据碎片化痛点的呼声。根据最新动态，这一功能于率先向Business、Enterprise和Edu计划用户开放，已在全球范围内引发热议。它标志着ChatGPT从通用聊天工具向深度企业助理的华丽转身，帮助团队高效整合散布在多平台的内部知识。

10/27/2025 10:56:25 AM AI在线

DATAMIND：构建专业级数据分析智能体的可扩展方法论

大家好，我是肆〇柒。今天来看看来自浙江大学与阿里巴巴集团联合研究团队的最新工作——《Scaling Generalist Data-Analytic Agents》。这项研究不仅提出了名为 DATAMIND 的高质量数据合成与智能体训练框架，更训练出了在多项基准上超越 GPT-5 的开源数据分析智能体 DATAMIND-14B，为构建专业领域 Agentic AI 提供了一套可复现、可扩展的方法论。

10/27/2025 9:00:09 AM 肆零柒

仅100种子题，合成数据质量超GPT-5，阿里、上交提出Socratic-Zero框架

本文（共同）第一作者为王少博（上交 AI）、焦政博（上财）。（共同）通讯作者为魏虎（阿里巴巴）和张林峰（上交 AI）。本文其他作者来自阿里巴巴、武大、浙大等。

10/23/2025 4:45:09 PM

资讯热榜

免费！让图片放大不失真的位图转矢量图神器 Tmttool AI应用新纪元：2025中国AI应用排行榜榜单揭晓丨2025年1月 6秒视频10秒生成！全新AI视频神器 Grok Imagine 深度体验+元提示词分享最火、最全的Agent记忆综述，NUS、人大、复旦、北大等联合出品后悔没早发现！教你用谷歌Gemini生成精美PPT（附提示词） GGUF 是什么？一文看懂大模型里最火的模型格式 Sora、可灵、即梦哪家强？AI视频软件深度测评！ Mac也能跑Qwen3，一文看懂本地部署qwen 3配置要求

标签云

AI 人工智能 OpenAI AIGC 模型 ChatGPT 谷歌 DeepSeek AI新词 AI绘画大模型机器人数据 Midjourney 开源 Meta 微软智能用户 GPT 学习英伟达 Gemini 智能体技术马斯克 Anthropic 图像 AI创作训练 LLM 论文 AI for Science 代码腾讯苹果算法 Agent Claude 芯片具身智能 Stable Diffusion xAI 蛋白质人形机器人开发者生成式神经网络机器学习 AI视频 3D 字节跳动大语言模型 RAG Sora 百度研究 GPU 生成华为工具 AGI 计算生成式AI AI设计大型语言模型搜索亚马逊 AI模型视频生成特斯拉 DeepMind 场景 Copilot 深度学习 Transformer 架构 MCP 编程视觉

GPT-5

ChatGPT 每周处理200万保险难题，医疗查询占比超5%

GPT-5 首次独立攻克数学难题，透明化归因实验引发学界争论

OpenAI计算利润率飙升至70%！内部指标翻倍，商业化效率显著提升

OpenAI拟融资千亿美元，估值或冲8300亿——AI军备竞赛进入“万亿美元前夜”

AI 科学研究新基准:FrontierScience 评估模型推理能力

GPT-5展现惊人数学能力，助研究者节省一个月的工作时间

AI 离诺奖有多远?顶级模型在博士级物理基准测试“CritPt”中惨败，准确率不足10%

领先 AI 模型在复杂物理任务中表现不佳，仍需人类助力

OpenAI 发布新 GPT-5 模型，加速数学与科学研究

LMArena公布最新大模型排名：Claude、GPT-5与智谱GLM-4.6并列第一

刚刚，GPT-5.1发布，OpenAI开始拼情商

OpenAI深陷90亿美元现金流危机！技术光环难掩财务隐忧，Anthropic已悄然领跑盈利赛道

大模型AI扫地机器人 “翻车”：成功率仅 40%！家庭应用仍有待提高

DeepMind一篇论文终结十年之争！GPT-5推理靠世界模型

颤抖吧，Bug！OpenAI放出GPT-5「夜行神兽」，命中92%漏洞

OpenAI“Company Knowledge”上线 可以连接企业知识和数据源

DATAMIND：构建专业级数据分析智能体的可扩展方法论

仅100种子题，合成数据质量超GPT-5，阿里、上交提出Socratic-Zero框架

OpenAI“Company Knowledge”上线可以连接企业知识和数据源