模型

ChatGPT还没学会打电话，谷歌搜索AI已经替你电话约服务，还会谈价砍单！

谷歌搜索要出新花样了！想象一下，你想给你的宠物狗做一次美容，但是家附近好像没有这样的门店。你打开搜索，输入「附近的宠物美容师」，并且勾选了「让AI查价格」，然后接下来你就什么都不用做了。

7/17/2025 1:08:56 PM

1万tokens是检验长文本的新基准，超过后18款大模型集体失智

上下文扩展至1万tokens，LLM集体“失智”！且“智商”不是均匀下降，而是在一些节点突然断崖式下跌。比如Claude Sonnet 4，就是在1000tokens后准确率一路下滑，从90%降到60%。

7/17/2025 10:47:33 AM

投奔小扎，Jason Wei连发两篇博文公布“屠龙术”：一个公式看透AI，一条心法指引人生

Jason Wei:OpenAI研究科学家，OpenAI思维链研究开创者，《Chain-of-thought prompting elicits reasoning in large language models》论文第一作者，谷歌学术他引17000余次（CoT单篇），高中学历，毕业于全美顶级的科技高中：托马斯·杰弗逊科学技术高中，sat 2390（2400满分），强化学习大神。在刚刚爆出被小扎挖走，加入meta超级智能实验室后，Jason Wei 连发两篇文章，一篇是关于 AI 发展的核心驱动力公式——“验证者定律”，另一篇则是从强化学习中悟出的人生哲学——“人生要走 On-Policy 路线”，这可能就是jason wei 在OpenAI最后的遗作了吧。验证者定律说的是：训练人工智能解决一个任务的难易程度与该任务的可验证性成正比。

7/17/2025 9:24:08 AM

面对无解问题大模型竟会崩溃？港中文&华为联合提出首个大模型推理可靠性评估基准

本文作者是香港中文大学博士三年级薛博阳，导师为黄锦辉教授，目前在伦敦大学学院进行访问交流，他的研究方向包括可信大模型，模型不确定性，对话系统等，在 ACL, EMNLP, TASLP 等会议期刊作为第一作者发表多篇论文，并长期在知乎写作大模型、机器学习等专栏文章，个人主页为：？今年初以 DeepSeek-r1 为代表的大模型在推理任务上展现强大的性能，引起广泛的热度。然而在面对一些无法回答或本身无解的问题时，这些模型竟试图去虚构不存在的信息去推理解答，生成了大量的事实错误、无意义思考过程和虚构答案，也被称为模型「幻觉」问题，如下图（a）所示，造成严重资源浪费且会误导用户，严重损害了模型的可靠性（Reliability）。

7/17/2025 9:21:11 AM

舍弃自回归，离散扩散语言模型如何演化？NUS综述解构技术图谱与应用前沿

本论文共同第一作者于润芃和李奇是新加坡国立大学 xML 实验室博士生，指导老师为王鑫超，研究方向是多模态大模型与可信深度模型。本文主要介绍 xML 团队的论文：Discrete Diffusion in Large Language and Multimodal Models: A Survey。论文链接：仓库： GPT 引爆大语言模型热潮以来，自回归的大语言模型（LLMs）与多模态模型（MLLMs）已成为智能系统的基石。

7/17/2025 9:16:20 AM

机器之心

马斯克的Neuralink梦想成真？意识连续谱理论震惊科学界！

马斯克Neuralink野心理论上被证实！ Michael Levin探讨了意识与自我组装的关系，强调意识是一个连续谱系。 Levin是美国著名的发育生物学家和合成生物学家，近期，他在采访中深入探讨了意识和自我组织的关系，聚焦于生物和人工系统。

7/16/2025 1:14:13 PM

OpenAI离职员工自曝：干了一年就润了！007压力逼到极限，AGI成宗教

外界对于OpenAI众说纷纭，很少有人从内部视角描述它的真实文化。三周前，在推出Codex后，Calvin French-Owen离开了OpenAI。在2024年5月，他加入了OpenAI，全程见证了OpenAI编程智能体Codex的诞生。

7/16/2025 1:09:46 PM

模仿学习新范式，Chain-of-Action：轨迹自回归实现动作推理

论文标题：Chain-of-Action: Trajectory Autoregressive Modeling for Robotic Manipulation主页链接：：：（Embodied AI）作为人工智能领域的前沿方向，旨在赋予机器人或智能体在物理世界中感知、决策和行动的能力。近年来，尽管视觉 - 语言 - 动作模型（Vision Language Action, VLA）已经取得了诸多进展，但具身智能领域尚未迎来「GPT 时刻」。越来越多的研究人员开始相信，仅仅增加模型规模和数据量似乎不足以创造出通用操作模型，如果我们想要充分释放现有数据的潜力，就需要找到更有效的机器人操作建模方法。

7/16/2025 10:42:32 AM

突发｜思维链开山作者Jason Wei被曝加入Meta，机器之心独家证实：Slack没了

这或许是目前为止，扎克伯格挖走的最强技术人才。就在刚刚，外媒 Wired 的一位资深 AI 领域记者爆料称，「多个消息源证实，OpenAI 知名研究员 Jason Wei 和另一位研究科学家 Hyung Won Chung 将双双离职，投奔 Meta。」并且，他们二人的 Slack 账号已经被停用。

7/16/2025 10:39:05 AM

基于闪电注意力机制，创新高效开源大模型

从数学竞赛、编程到自然语言处理，通过大规模的强化学习的模型正不断提升其推理能力。但传统的Transformer架构由于其注意力机制的二次计算复杂度，在处理长文本和复杂推理任务时面临着效率瓶颈。尽管有研究提出了多种改进方法，如稀疏注意力、线性注意力等，但这些方法在大规模推理模型中的应用效果尚未得到充分验证，大多数领先的模型仍然依赖于传统的注意力设计。

7/16/2025 10:15:51 AM

完全透明开源的共情语音大模型，三阶段训练，四大模块实现端到端对话

GPT-4o、Gemini这些顶级语音模型虽然展现了惊人的共情对话能力，但它们的技术体系完全闭源。现在，紫东太初团队联合长城汽车AI Lab直接把整个技术栈都开源了，推出完全透明开源的端到端共情语音语言大模型OpenS2S。 OpenS2S的核心在于提供一个高效、低成本构建共情语音系统的新范式。

7/16/2025 10:12:35 AM

首篇潜空间推理综述！模型思考不必依赖Token，带宽暴增2700+倍

大模型在潜空间中推理，带宽能达到普通（显式）思维链（CoT）的2700多倍？史上首篇潜空间推理综述，对这种新兴的推理范式进行了全面总结。这篇综述当中，作者分析了循环、递归、连续思维等潜空间推理的形式，并将这些方法总结成了一个框架。

7/16/2025 10:08:57 AM

老黄投了个120亿美元最贵种子轮！但小钱：H20中国开卖，市值一夜暴涨1600亿美元

种子轮，估值120亿美元！硅谷乃至全球创纪录的创业种子轮诞生了。 OpenAI前CTO Mira创业公司，Thinking Machines Lab——思考机器实验室，刚刚公告了首款融资情况：顺利筹集约20亿美元（约合人民币143亿元），公司估值一夜飙升至120亿美元（约合人民币861亿元），成为硅谷史上最大种子轮之一。

7/16/2025 10:03:14 AM

加拿大丛林迷路五小时，ChatGPT救命神技，比地图还靠谱！

最近，X平台上一个帖子火了，一群人在加拿大偏远的小镇Mabou骑全地形车（ATV）玩，结果迷路了整整五小时，最后靠ChatGPT导航才安全回来。 Mabou是个小地方，周围全是没开发过的森林和小路。他们本来打算从Upper Southwest Mabou Rd出发，骑18公里到Whycocomagh玩一圈。

7/16/2025 9:58:47 AM

倒反天罡：ChatGPT教人说话？36万视频+77万播客已证实！

AI驯服人类第一步：教人重新说英语？最近，越来越多的媒体发现：说话的方式，越来越像ChatGPT了！这不是模仿，而是「入侵」。

7/16/2025 9:52:07 AM

秘塔AI整大活，国内首个免费「深度研究」来了！搞研究证据链惊人

就在刚刚，国内第一家免费公开可用的「深度研究」产品来了！这个产品，可以直接对标海外的Deep Research能力，性能十分强大。在BrowseComp等评测集上，它们超越了上周刚开源且达到最好结果的WebSailor模型，准确率有明显提升。

7/16/2025 9:48:23 AM

五个月估值120亿！OpenAI前CTO自曝首个多模态AI，竟要免费开源

OpenAI前CTO初创，又拿到新融资了！一早，Mira Murati官宣由a16z领投20亿美元融资，至此，Thinking Machines Lab估值120亿美元。同时，英伟达、AMD、Accel、ServiceNow等多家明星风投也参与了本次融资。

7/16/2025 9:44:29 AM

一篇被证明“理论有误”的论文，拿下了ICML2025时间检验奖

深度学习界的传奇论文，终于等来了它的“封神”时刻！刚刚，ICML 2025会议上，2015年发表的Batch Normalization（批次归一化，简称BatchNorm）论文荣获时间检验奖。这篇如今引用量超过6万次的开创性工作，是深度学习发展史上一个里程碑式的突破，极大地推动了深层神经网络的训练和应用。

7/16/2025 9:15:17 AM

资讯热榜

阿里推出 AI 医学助手 App“氢离子”：收录千万级核心期刊文献，还可查疾病、找药品共青年之智，铸AGI未来｜2025 WAIC云帆奖得主名单揭晓腾讯Robotics X具身智能开放平台Tairos发布，融合左脑、右脑、小脑刷新无监督异常检测上限！首提「匹配代价滤波for异常检测」范式 | ICML'25 业界首个，腾讯混元 3D 世界模型正式发布并开源 AI和云基础设施初创企业E2B如何成为88%的财富100强企业的必备选择 AI 预测点球方向准确率超人类守门员，高达 52% FastAPI开发AI应用：模型新增图片理解

标签云

人工智能 AI OpenAI AIGC 模型 ChatGPT DeepSeek AI绘画谷歌机器人数据大模型 Midjourney 开源智能用户 Meta 微软 GPT 学习技术图像 Gemini AI创作马斯克论文智能体 Anthropic 英伟达代码算法训练 Stable Diffusion 芯片蛋白质开发者腾讯生成式 LLM 苹果 Claude 神经网络 AI新词 3D 研究机器学习生成 AI for Science Agent xAI 计算人形机器人 Sora AI视频 GPU AI设计百度华为搜索大语言模型工具场景字节跳动具身智能 RAG 大型语言模型预测深度学习伟达视觉 Transformer AGI 视频生成神器推荐亚马逊 Copilot DeepMind 架构模态应用

模型