GPT-5
ChatGPT 每周处理200万保险难题,医疗查询占比超5%
据 AIbase 报道,OpenAI 近期向 Axios 提供的一份独家报告揭示了一个惊人的趋势:健康医疗已成为 ChatGPT 最核心的使用场景之一。 全球范围内超过5% 的查询与健康相关,而在美国,每天有约4000万人向这款 AI 寻求医疗建议。 从解析晦涩的医疗账单、对比保险方案到初步检查病症,ChatGPT 正在成为许多无法立即预约医生的美国人眼中的“医疗盟友”。
GPT-5 首次独立攻克数学难题,透明化归因实验引发学界争论
瑞士数学家约翰内斯·施密特(Johannes Schmitt)近期在 X 上发布了一项足以载入史册的研究成果:GPT-5在没有任何人类干预或提示引导的情况下,首次独立解决了一个长期未解的数学难题。 施密特评价称,GPT-5的解决方案展现了令人惊叹的创造力,它并未遵循该领域的常规逻辑,而是跨界借鉴了代数几何其他分支的技术手段。 这一突破不仅印证了数学大师陶哲轩此前对 AI 潜力的预判,更将科学界推向了一个必须直面“AI 独立贡献”的新阶段。
OpenAI计算利润率飙升至70%!内部指标翻倍,商业化效率显著提升
在巨额投入与高调扩张的表象之下,OpenAI正悄然实现商业化效率的惊人跃升。 据多位知情人士透露,截至 2025 年 10 月,OpenAI内部关键指标——“计算利润率”(Compute Profit Margin)已攀升至70%,较 2024 年底的52%大幅提升,更是 2024 年 1 月水平的两倍。 这一数据虽未获官方正式确认(OpenAI发言人回应称“不披露该指标”),却释放出强烈信号:这家曾以“烧钱”著称的AI巨头,正加速从技术先锋向高效率盈利引擎转型。
OpenAI拟融资千亿美元,估值或冲8300亿——AI军备竞赛进入“万亿美元前夜”
OpenAI正谋划一场史无前例的融资行动,试图为其雄心勃勃的AI帝国铺就资金基石。 据知情人士透露,该公司计划筹集最多 1000 亿美元,若按此上限全额完成,其估值将飙升至 8300 亿美元——这一数字不仅远超多数科技巨头,更逼近全球市值最高企业的门槛。 据悉,此轮融资目前仍处于早期阶段,目标是在 2025 年第一季度末前完成。
AI 科学研究新基准:FrontierScience 评估模型推理能力
在科学研究中,推理能力至关重要。 科学家们不仅仅是回忆事实,还需提出假设、测试并修正这些假设,并在不同领域之间综合思想。 随着 AI 模型能力的提升,如何评估它们在科学研究中深度推理的能力成为了一个重要问题。
GPT-5展现惊人数学能力,助研究者节省一个月的工作时间
在人工智能领域,最新的进展引发了广泛关注。 OpenAI 的研究员塞巴斯蒂安・布贝克(Sebastien Bubeck)近日在社交媒体平台 X 上分享了他与新一代语言模型 GPT-5的合作经历。 他表示,GPT-5在处理复杂数学任务方面表现卓越,能够完成他原本需要一个月才能完成的工作,仅用一个下午就高效解决了问题。
AI 离诺奖有多远?顶级模型在博士级物理基准测试“CritPt”中惨败,准确率不足10%
据 AIbase 报道,一项名为“CritPt”的全新物理基准测试结果显示,即使是目前最顶尖的人工智能模型,如 Gemini3Pro 和 GPT-5,距离成为真正的自主科学家仍有巨大的差距。 该基准测试旨在将领先的 AI 模型置于博士早期研究水平进行严苛考核。 CritPt:检验 AI 的科研实战能力“CritPt”由来自全球30多个机构的50多位物理学家共同构建。
领先 AI 模型在复杂物理任务中表现不佳,仍需人类助力
近日,由全球超过50位物理学家联合开发的 “CritPt” 基准测试,旨在评估顶尖 AI 模型在处理未公开的复杂物理研究问题时的能力。 测试的目标是模拟早期博士研究生所需的独立研究水平。 尽管目前的 AI 系统如谷歌的 “Gemini3Pro” 和 OpenAI 的 “GPT-5” 被寄予厚望,但结果却令人失望。
OpenAI 发布新 GPT-5 模型,加速数学与科学研究
近日,OpenAI 宣布推出其最新的 GPT-5模型,这一新技术有望在数学和科学研究领域带来显著的加速。 随着人工智能技术的快速发展,各大科技公司纷纷看好 AI 在药物研发和新材料发现方面的潜力。 GPT-5模型的推出,正是顺应这一趋势,旨在帮助科研人员更高效地解决复杂问题。
LMArena公布最新大模型排名:Claude、GPT-5与智谱GLM-4.6并列第一
近日,全球知名的 AI 模型评测平台 LMArena 公布了最新的 AI 大模型排名,令人瞩目的是,美国的 Anthropic 公司推出的 Claude、OpenAI 的 GPT-5 以及智谱科技的 GLM-4.6,这三款 AI 编程模型在排行榜上不分上下,齐齐占据了全球第一的位置。 这些模型专为编程任务而设计,旨在帮助开发者更加高效地进行代码编写、调试和优化。 随着科技的不断进步,AI 编程模型的出现不仅提升了软件开发的效率,也为各类开发者提供了强大的工具支持。
刚刚,GPT-5.1发布,OpenAI开始拼情商
深夜,GPT-5 系列迎来大更新:上线 GPT-5.1 Instant 以及 GPT-5.1 Thinking 模型:GPT-5.1 Instant:ChatGPT 最常用的模型,更温暖、更智能,也更善于遵循指令的模型。 GPT-5.1 Thinking:高级推理模型,在简单任务上更快,在复杂任务上更持久,也更容易理解。 对于新上线的模型,OpenAI 表示出色的 AI 不仅要聪明,还要让人与之对话变得愉悦。
OpenAI深陷90亿美元现金流危机!技术光环难掩财务隐忧,Anthropic已悄然领跑盈利赛道
据最新披露的内部文件显示,OpenAI预计未来将面临高达90亿美元的负自由现金流——这一数字不仅刷新行业认知,更将这家全球最受瞩目的AI公司推入“技术领先与财务可持续”的尖锐矛盾之中。 负现金流警报:烧钱速度远超收入增长自由现金流为负,意味着OpenAI在支付所有运营开支与资本投入后,现金净流出高达90亿美元。 这一巨额缺口主要源于三重压力:基础设施激进扩张:为支撑GPT-5、Sora及AI智能体生态,公司持续加码GPU集群与数据中心建设;人才争夺战白热化:顶尖AI研究员年薪普遍突破百万美元,团队规模快速膨胀;产品免费策略:尽管ChatGPT坐拥8亿周活用户,但免费版占比过高,商业化变现仍处爬坡期。
大模型AI扫地机器人 “翻车”:成功率仅 40%!家庭应用仍有待提高
最近,AI 实验室 Andon Labs 进行了一项引人注目的研究,专门评估了搭载顶级大模型的扫地机器人在完成简单家务任务时的表现。 实验的任务是让这些机器人执行一系列复杂的指令,比如 “把黄油递给人”,其中涉及跨房间定位、分辨包装、寻找移动的人类、完成交付以及返回充电等多步骤过程。 然而,结果让人震惊。
DeepMind一篇论文终结十年之争!GPT-5推理靠世界模型
GPT-5上线后,最让人震惊的不是它能写诗画画,而是它展现出的推理能力。 网友惊呼:「感觉像是在和博士讨论问题」,媒体更是直言它的逻辑水平已经「堪比专家」。 为什么会出现这种「突然开窍」的效果?
颤抖吧,Bug!OpenAI放出GPT-5「夜行神兽」,命中92%漏洞
刚刚,OpenAI推出了使用GPT-5寻找和修复安全漏洞的智能体Aardvark。 目前,Aardvark还处于beta测试阶段。 OpenAI称,Aardvark开创了「防御者优先」的新范式:作为自主安全研究智能体,随代码不断演化,为团队提供持续保护(continuous protection)。
OpenAI“Company Knowledge”上线 可以连接企业知识和数据源
OpenAI正式推出ChatGPT的“Company Knowledge”功能,这一创新直接响应了企业用户对数据碎片化痛点的呼声。 根据最新动态,这一功能于率先向Business、Enterprise和Edu计划用户开放,已在全球范围内引发热议。 它标志着ChatGPT从通用聊天工具向深度企业助理的华丽转身,帮助团队高效整合散布在多平台的内部知识。
DATAMIND:构建专业级数据分析智能体的可扩展方法论
大家好,我是肆〇柒。 今天来看看来自浙江大学与阿里巴巴集团联合研究团队的最新工作——《Scaling Generalist Data-Analytic Agents》。 这项研究不仅提出了名为 DATAMIND 的高质量数据合成与智能体训练框架,更训练出了在多项基准上超越 GPT-5 的开源数据分析智能体 DATAMIND-14B,为构建专业领域 Agentic AI 提供了一套可复现、可扩展的方法论。
仅100种子题,合成数据质量超GPT-5,阿里、上交提出Socratic-Zero框架
本文(共同)第一作者为王少博(上交 AI)、焦政博(上财)。 (共同)通讯作者为魏虎(阿里巴巴)和张林峰(上交 AI)。 本文其他作者来自阿里巴巴、武大、浙大等。
资讯热榜
标签云
AI
人工智能
OpenAI
AIGC
模型
ChatGPT
谷歌
DeepSeek
AI新词
AI绘画
大模型
机器人
数据
Midjourney
开源
Meta
微软
智能
用户
GPT
学习
英伟达
Gemini
智能体
技术
马斯克
Anthropic
图像
AI创作
训练
LLM
论文
AI for Science
代码
腾讯
苹果
算法
Agent
Claude
芯片
具身智能
Stable Diffusion
xAI
蛋白质
人形机器人
开发者
生成式
神经网络
机器学习
AI视频
3D
字节跳动
大语言模型
RAG
Sora
百度
研究
GPU
生成
华为
工具
AGI
计算
生成式AI
AI设计
大型语言模型
搜索
亚马逊
AI模型
视频生成
特斯拉
DeepMind
场景
Copilot
深度学习
Transformer
架构
MCP
编程
视觉