资讯列表

分类

标签

NeurIPS 2025 Spotlight | 让检索、推理真正「合体」的小而强模型，AceSearcher来了

如何让一个并不巨大的开源大模型，在面对需要多步检索与复杂逻辑整合的问题时，依然像 “冷静的研究员” 那样先拆解、再查证、后归纳，最后给出可核实的结论？近期，来自埃默里大学，佐治亚理工大学，罗格斯大学，纽约州立大学奥尔巴尼分校，得克萨斯大学西南医学中心的研究团队发布 AceSearcher 模型，一个让同一语言模型在推理时兼任 “问题分解者（Decomposer）” 与 “答案求解者（Solver）” 的合作式自博弈框架：它以两阶段训练（SFT→RFT）为骨架，把 “会拆题、会找料、会整合” 的完整能力链拧成了一根绳。更重要的是，这不是单纯的 “又一个新模型”，而是一个更优的框架：它把公开的推理数据集引入到检索增强的训练流程中，让模型真正学会如何把推理与检索结合起来，显著提升了复杂检索任务的效果。

10/24/2025 1:34:00 PM

机器之心

均值至上假繁荣！北大新作专挑难题，逼出AI模型真本事

当强化学习（RL）成为大模型后训练的核心工具，「带可验证奖励的强化学习（RLVR）」凭借客观的二元反馈（如解题对错），迅速成为提升推理能力的主流范式。从数学解题到代码生成，RLVR本应推动模型突破「已知答案采样」的局限，真正掌握深度推理逻辑——但现实是，以GRPO为代表的主流方法正陷入「均值优化陷阱」。这些基于均值的优化策略，过度聚焦高概率输出序列，却忽略了「低概率但高信息密度」的推理路径：模型训练早期就会出现熵坍缩，过早丧失探索能力；面对全错的难题时，优势函数直接归零，模型在薄弱环节完全无法学习。

10/24/2025 1:04:00 PM

红色警报：OpenAI的Atlas浏览器，是捅向谷歌万亿心脏的匕首吗？

浏览器「第三次世界大战」打响！ OpenAI向谷歌扔下一个AI核弹，谁能掌握未来互联网之门的钥匙？一觉醒来，变天了！

10/24/2025 12:50:34 PM

新智元

李开复：美国在AI硬件赛道已败给中国！中国AI算力将是美国十倍！警告AI速度失控：先上车再修路，将酿成重大事故！

编辑 | 云昭在旧金山TED AI大会上，创新工场董事长、AI科学家李开复通过视频连线发表演讲，罕见地直言：“在AI硬件和机器人制造方面，美国正在被中国超越。 ”李表示，这一点也不夸张。在AI硬件与机器人赛道，中国的领先正在成为事实。

10/24/2025 12:45:11 PM

云昭

AI数据中心公司Crusoe完成13. 8 亿美元股权融资，估值突破 100 亿美元

人工智能（AI）数据中心公司Crusoe周四宣布，已通过一轮股权融资成功筹集13. 8 亿美元，公司估值一举突破 100 亿美元大关。此轮融资的成功，凸显了投资者对AI基础设施市场爆炸性增长的巨大信心。

10/24/2025 12:36:38 PM

AI在线

一图胜千言被实现了！DeepSeek-OCR用图片压缩文本，10倍压缩率

DeepSeek开源了DeepSeek-OCR，用1张图片的信息，还原10页书的文字，10倍的压缩率，可以做到几乎不丢失信息。视觉编码器走了不少弯路大型语言模型记性不好，或者说，能记住的东西太有限。你给它一篇长长的文章，它的计算量呈二次方往上飙。

10/24/2025 12:19:18 PM

斯坦福与Adobe新研究，模仿蒸馏技术轻松让200亿参数图像生成高质量大模型

高质量图像生成又加速了！斯坦福大学和 Adobe 研究院联手，用 pi-Flow（基于策略的流模型）技术，让 200 亿参数的文本到图像大模型，在 4 步之内就生成了媲美教师模型的高质量、高多样性图片。让图像生成模型少走几步所有玩过 AI 绘画的人都有一个共同的体验，未蒸馏的原版大模型，点击生成，看着进度条一点点爬升，从一个模糊的噪声，慢慢变得清晰。

10/24/2025 12:17:22 PM

AI在线强化学习“边做边学”，斯坦福团队让7B小模型性能飙升，甚至超越GPT-4o

允中发自凹非寺. 量子位 | 公众号 QbitAI斯坦福等新框架，用在线强化学习让智能体系统“以小搏大”，领先GPT-4o——. AgentFlow，是一种能够在线优化智能体系统的新范式，可以持续提升智能体系统对于复杂问题的推理能力。

10/24/2025 12:16:56 PM

西风

干家务一小时挣1000元，具身智能时代人类新岗位

西风发自凹非寺. 量子位 | 公众号 QbitAI注意看，眼前这个男人暂且叫他小帅。你可能想不到，他只是在厨房里优雅地煎牛排做做家务，每小时最高能赚进1000多块（150美元）。

10/24/2025 12:09:09 PM

西风

AI时代，开发者不能再当 i 人了，「云计算代言人」敬告

开发者不能再内向了：要会和客户同事说，会和 AI 说。「我想说的很明确：现在我们有了更多学习新技术的机会，但最有意思的是，很多技巧并非技术。我坚信，未来最成功的开发者，必须拥有强大的沟通能力。

10/24/2025 12:06:00 PM

机器之心

八年后，Meta教会了Transformer「显式思考」

最近的 Meta 可谓大动作不断，一边疯狂裁人，一边又高强度产出论文。 10 月 20 日，他们又上线了一篇新论文《The Free Transformer》，作者只有一位，日内瓦大学教授、Meta 研究科学家 François Fleuret。有意思的是，François 所在的 FAIR 是 Meta 近日裁员最严重的部门之一。

10/24/2025 12:00:00 PM

机器之心

腾讯发布SpecExit算法，无损压缩端到端加速2.5倍！解决大模型长思考效率难题

以 DeepSeek-R1 等为代表的推理模型（Large Reasoning Models, LRMs），通过生成更长的思维链，在各类复杂任务中取得了更优的表现。但长思维链是推理模型的 “双刃剑”，虽能提升性能，但 “过度思考” 带来的语义冗余会大幅推高推理成本。为破解大模型长思维链的效率难题，并且为了更好的端到端加速落地，我们将思考早停与投机采样无缝融合，提出了 SpecExit 方法，利用轻量级草稿模型预测 “退出信号”，在避免额外探测开销的同时将思维链长度缩短 66%，vLLM 上推理端到端加速 2.5 倍。

10/24/2025 11:56:00 AM

机器之心

夸克AI眼镜开售，88VIP叠加9折消费券，超低价格仅需3329元

10月24日零点，阿里巴巴首款自研的夸克AI眼镜在其天猫官方店铺——夸克智能设备旗舰店上正式首发。天猫平台的实时成交竞速榜单显示，新品上线销售后仅7个小时，便成为双11期间智能眼镜行业top2品牌。不少消费者已经在社交媒体及粉丝群里陆续晒出购买订单。

10/24/2025 11:18:54 AM

MinerU2.5源码拆解：双后端架构设计与企业级部署实践

8月中旬的时候，我去MinerU的办公室交流过一次。当时对方有位工作人员表示，接下来会很快基于视觉模型的路线实现全面 SOTA。说实话，那个时候我还挺怀疑的。

10/24/2025 11:16:41 AM

韦东东

基于JoyAgent的二开工程实践（信贷尽调报告生成）

很久没更新，书稿终于写完了，后续恢复每周一到两更。这篇来继续聊聊 Agent, 这个现在有些烂大街的概念。我在历史文章中提到 Agent 的案例演示时，大多是围绕 Dify，介绍了些诸如设备预测性运维、多源异构数据分析等使用场景。

10/24/2025 11:12:14 AM

韦东东

人工智能的“苦涩教训”：辛顿最清醒的警告

在人工智能的历史上，杰弗里·辛顿（Geoffrey Hinton）不仅是深度学习的奠基人，更像是一个时代的镜子。他提出的“苦涩的教训（The Bitter Lesson）”，直到今天，依然是AI研究者绕不开的一记耳光——它提醒我们，聪明的人类往往高估了自己设计“聪明系统”的能力，而低估了计算和数据的力量。这条教训，之所以“苦涩”，是因为它击中了人类的骄傲。

10/24/2025 11:00:58 AM

AI大模型应用开发

多轮交互驱动的Text-to-SQL智能体

在大语言模型（LLM）风头正劲的当下，让普通用户用自然语言向数据库提问、自动生成 SQL 查询成为一种重要探索方向，即所谓 Text-to-SQL 技术。尽管近年来已有不少成果，但在真实场景下，Text-to-SQL 仍存在一些挑战，尤其是在多轮交互、宽表（很多列）查询、可解释性等方面：用户常常不是一次性把完整问题说出来，而是一步步迭代补充、提出子问题数据库表可能列很多、关系复杂，模型在“选列”“join”“过滤条件”上容易出错模型直接给一个 SQL 字符串，往往不透明、难以调试与纠错这篇论文 “Interactive-T2S” 正是在这类痛点中切入，提出一种交互式、多轮驱动的 Text-to-SQL 框架，让模型在生成 SQL 的过程中向数据库“发问”、拉取信息，从而提高准确性与可解释性。下面，我们从核心思路、方法设计、实验结果及未来展望四个层面解读。

10/24/2025 10:58:24 AM

Apache Doris 4.0 把 AI 塞进数据库了！？

“哥，Doris 4.0 把 AI 塞进数据库了！ ”凌晨一点，DBA老周在群里甩出这句话，附带一张截图：一条 SQL 直接调通简历筛选，把 30 万份数据 3 秒跑完。我盯着屏幕，咖啡差点洒键盘——这年头，连数据库都开始抢 HR 的饭碗？

10/24/2025 10:51:05 AM

大数据AI智能圈

资讯热榜

看完刘润年度演讲，教你做好AI时代的能力迁徙！后悔没早发现！教你用谷歌Gemini生成精美PPT（附提示词） 10分钟教会机器人工作?上海AgiBot正在重写制造业规则谷歌推出新款 Vertex AI 代理构建工具，助力企业智能化中国华电发布 “华电智” 大模型，能源管理进入智能新时代谷歌流量显著下降，People Inc. 与微软达成 AI 内容授权协议 AMD CEO 透露：多家OpenAI 级别客户争相采购AI芯片 AI 的本质不是算力，而是「上下文革命」

标签云

AI 人工智能 OpenAI AIGC 模型 ChatGPT DeepSeek 谷歌 AI绘画大模型机器人数据 Midjourney 开源 Meta AI新词微软智能用户 GPT 学习技术智能体马斯克 Gemini 图像 Anthropic 英伟达 AI创作训练 LLM 论文代码算法 AI for Science Agent 苹果芯片 Claude 腾讯 Stable Diffusion 蛋白质开发者生成式神经网络 xAI 机器学习 3D RAG 人形机器人 AI视频研究大语言模型具身智能生成百度 Sora 工具 GPU 华为计算字节跳动 AI设计大型语言模型 AGI 搜索视频生成场景深度学习生成式AI 架构 DeepMind 亚马逊编程特斯拉视觉 Transformer AI模型预测 MCP