AI在线 AI在线

资讯列表

下一代目标检测模型:3B参数MLLM Rex-Omni首度超越Grounding DINO,统一10+视觉任务

多模态大语言模型(MLLM)在目标定位精度上被长期诟病,难以匹敌传统的基于坐标回归的检测器。 近日,来自 IDEA 研究院的团队通过仅有 3B 参数的通用视觉感知模型 Rex-Omni,打破了这一僵局。 该模型将所有视觉感知任务统一为「下一个点预测」,并结合高效的 4-Token 坐标编码和两阶段 GRPO 强化学习后训练。
11/13/2025 4:43:00 PM
机器之心

李彦宏:萝卜快跑全球第一,累计订单数已超Waymo

杰西卡 发自 副驾寺. 智能车参考 | 公众号 AI4Auto“萝卜快跑,全球第一。 ”.
11/13/2025 4:39:13 PM
杰西卡

百度文库网盘发布GenFlow3.0,活跃用户超2000万,“超级应用成就超级个体”

允中 发自 凹非寺. 量子位 | 公众号 QbitAI11月13日,百度世界2025在北京召开。 大会上,百度文库、百度网盘正式发布GenFlow3.0,活跃用户超2000万,已成为「全球最大通用智能体」。
11/13/2025 4:22:09 PM
西风

Nature公开谷歌IMO金牌模型技术细节!核心团队仅10人,一年给AI编出8000万道数学题训练

梦晨 发自 凹非寺量子位 | 公众号 QbitAI谷歌DeepMind的IMO金牌模型,完整技术全公开了! 延续DeepMind的命名传统,这次叫:AlphaProof。 依然是Nature刊发的形式,放出了AlphaProof的完整论文,首次详细公开了其背后的技术架构和训练方法。
11/13/2025 3:55:51 PM
梦晨

滴滴自动驾驶出海,首站落户中东阿布扎比

11月12日,滴滴自动驾驶宣布与阿布扎比投资办公室(ADIO)达成战略合作。 滴滴自动驾驶加入阿布扎比智能和自动驾驶汽车产业集群SAVI,双方将在自动驾驶技术创新应用、AI人才培养、生态建设等领域开放合作,共同支持阿布扎比建设领先的智慧出行和可持续交通生态,并逐步将合作拓展至更广泛的中东地区。 滴滴联合创始人、滴滴自动驾驶CEO张博(左)与阿布扎比投资办公室总干事H.E.
11/13/2025 3:43:27 PM
一水

即刻下载!威立最新AI调研报告ExplanAItions 2025:科研人员AI使用率大幅跃升,但仍需更多权威指南

今年2月,威立发布了基于对近5000名科研人员进行调研的研究报告ExplanAItions。 时隔半年,依托新一轮调研中由全球2430位科研人员反馈的最新数据,威立重磅推出ExplanAItions 2025。 ,科研人员对人工智能仍持乐观态度,其中85%的受访者认为AI提升了他们的工作效率,近四分之三的受访者表示AI既增加了工作产出也提升了工作质量。
11/13/2025 1:51:00 PM
ScienceAI

终于,TRAE SOLO全量开放,我们用它复刻了PewDiePie的大模型智囊团

TRAE SOLO 正式版,终于来了。 在 2025 年的 AI Coding 赛道,TRAE 无疑是 AI IDE 的国产代表作。 今年 7 月 21 日,TRAE 推出的 SOLO Beta 版本着实是火了一把。
11/13/2025 1:25:00 PM
机器之心

2M大小模型定义表格理解极限,清华大学崔鹏团队开源LimiX-2M

提到 AI 的突破,人们首先想到的往往是大语言模型(LLM):写代码、生成文本、甚至推理多模态内容,几乎重塑了通用智能的边界。 但在一个看似 “简单” 的领域 —— 结构化表格数据上,这些强大的模型却频频失手。 电网调度、用户建模、通信日志…… 现实世界中大量关键系统的核心数据都以表格形式存在。
11/13/2025 1:14:00 PM
机器之心

跨层压缩隐藏状态同时加速TTFT和压缩KV cache!

我们都知道 LLM 中存在结构化稀疏性,但其底层机制一直缺乏统一的理论解释。 为什么模型越深,稀疏性越明显? 为什么会出现所谓的「检索头」和「检索层」?
11/13/2025 1:10:00 PM
机器之心

GRPO训练不再「自嗨」!快手可灵 x 中山大学推出「GRPO卫兵」,显著缓解视觉生成过优化

论文第一作者为王晶,中山大学二年级博士生,研究方向为强化学习与视频生成;通讯作者为中山大学智能工程学院教授梁小丹。 目前,GRPO 在图像和视频生成的流模型中取得了显著提升(如 FlowGRPO 和 DanceGRPO),已被证明在后训练阶段能够有效提升视觉生成式流模型的人类偏好对齐、文本渲染与指令遵循能力。 在此过程中,重要性比值的 clip 机制被引入,用于约束过于自信的正负样本梯度,避免破坏性的策略更新,从而维持训练的稳定性。
11/13/2025 1:04:00 PM
机器之心

上海旗舰SUV太有生活了:自带淋浴和地暖,32万开卖

智己LS9,基本锁定年度9系卷王了。 以上汽之名,智己发布了旗舰车型LS9,一款车长近5.3米的六座SUV,分为32.28万和35.28万两个版本。 520线激光雷达,英伟达Thor芯片,新一代数字底盘,Momenta一段式端到端……这些全部标配,智能化拉满。
11/13/2025 12:48:08 PM
一凡

全球首个AI Agent交易市场MuleRun发布2.0版本,上线一个月用户数突破50万

11月13日凌晨0点,全球首个AI Agent交易市场MuleRun(骡子快跑)发布2.0版本,核心升级点包括为用户配置专属Agent团队,和上线多种垂直场景的Agent专题等。 自2025年9月MuleRun发布正式版本以来,仅一个月时间,注册用户数已突破50万,其中美国用户占比最高,达27.43%。 目前,已有上万名全球创作者报名入驻MuleRun,其中包括Quick BI、Funda AI、Piccopilot AI等在内的50 专业团队,为用户提供覆盖电商、数据分析、内容创作等多样化领域的160 Agent服务。
11/13/2025 11:34:31 AM
梦瑶

刚刚,GPT-5.1发布,OpenAI开始拼情商

深夜,GPT-5 系列迎来大更新:上线 GPT-5.1 Instant 以及 GPT-5.1 Thinking 模型:GPT-5.1 Instant:ChatGPT 最常用的模型,更温暖、更智能,也更善于遵循指令的模型。 GPT-5.1 Thinking:高级推理模型,在简单任务上更快,在复杂任务上更持久,也更容易理解。 对于新上线的模型,OpenAI 表示出色的 AI 不仅要聪明,还要让人与之对话变得愉悦。
11/13/2025 10:47:00 AM
机器之心

清华团队:1.5B 模型新基线!用「最笨」的 RL 配方达到顶尖性能

如果有人告诉你:不用分阶段做强化学习、不搞课程学习、不动态调参,只用最基础的 RL 配方就能达到小模型数学推理能力 SOTA,你信吗? 清华团队用两个 1.5B 模型给出了答案:不仅可行,还特别高效。 核心发现: 单阶段训练 固定超参数 = SOTA 性能 省一半算力意外之喜: 训练曲线平滑得像教科书,4000 步没遇到任何 "典型问题"关键启示: 充分 scale 的简单 baseline,可能比我们想象的强大得多技术博客::::RL 训练小模型的 "技术军备竞赛"2025 年初,DeepSeek-R1 开源后,如何用 RL 训练 1.5B 级别的推理模型成为了热门研究方向。
11/13/2025 10:44:00 AM
机器之心

中国医生需要怎样的AI?GPT-5、OpenEvidence都输掉实战后,我们有了答案

能真正帮到基层的AI,一定要满足2点:安全有效、人(医生)机(AI)协同。 「倒挂」一纸文件,又将医疗 AI 推到了聚光灯下。 11 月 4 日,国家卫健委发文(以下简称「实施意见」),定调医疗 AI 未来五年的核心目标——「人工智能 基层应用」,被放在「人工智能 医疗卫生」的八大重点方向的首位。
11/13/2025 10:38:00 AM
机器之心

你以为在点「红绿灯」验证身份,其实是在给AI免费打工

如果这是下一代图形验证码,你怎么看? 感觉会经历无数遍「您对 CAPTCHA 的响应似乎无效。 请在下方重新验证您不是机器人」,不知道猫主子们怎么想。
11/13/2025 10:27:00 AM
机器之心

IHES Library:解锁数学物理界的「智慧圣殿」

当现代代数几何的基石由格罗滕迪克奠定,当非交换几何的疆界被孔涅开拓——这些曾在顶尖研究所闪耀的思想火种,如今正式向你敞开大门! 茶思屋科技网站全新上线 IHES Library,收录法国高等科学研究所(Institut des Hautes Études Scientifiques)的 2369 个优质学术视频,由 8 位菲尔兹奖获得者领衔、479 位数学家讲授。 目前 Library 首期已发布 686 个课程视频,后续 1683 个视频将陆续亮相,涵盖数学、物理及跨学科领域。
11/13/2025 10:20:00 AM
机器之心

NeurIPS 2025 | 中科大、港中深、通义千问联合发布CoRT:仅30个样本教会大模型高效推理,token消耗降低50%

近年来,以 OpenAI-o1、Qwen3、DeepSeek-R1 为代表的大型推理模型(LRMs)在复杂推理任务上取得了惊人进展,它们能够像人类一样进行长链条的思考、反思和探索。 然而,这些模型在面对精确的数学计算时,仍然会「心有余而力不足」,常常出现效率低下甚至算错的问题。 一个直观的解决方案,是为模型配备代码解释器(Code Interpreter)等计算工具。
11/13/2025 10:16:00 AM
机器之心