AI在线 AI在线

资讯列表

CUDA内核之神、全球最强GPU程序员?OpenAI的这位幕后大神是谁

在 AI 圈里,聚光灯总是追逐着那些履历光鲜的明星人物。 但一个伟大的团队,不仅有台前的明星,更有无数在幕后贡献关键力量的英雄。 之前我们介绍了 OpenAI 的两位波兰工程师,最近 OpenAI 又一位身处幕后的工程师成为了焦点。
10/1/2025 10:55:00 AM
机器之心

复旦、同济和港中文等重磅发布:强化学习在大语言模型全周期的全面综述

近年来,以强化学习为核心的训练方法显著提升了大语言模型(Large Language Models, LLMs)的推理能力与对齐性能,尤其在理解人类意图、遵循用户指令以及增强推理能力方面效果突出。 尽管现有综述对强化学习增强型 LLMs 进行了概述,但其涵盖范围较为有限,未能全面总结强化学习在 LLMs 全生命周期中的作用机制。 对此,来自复旦大学、同济大学、兰卡斯特大学以及香港中文大学 MM Lab 等顶尖科研机构的研究者们全面总结了大语言模型全生命周期的最新强化学习研究,完成题为 “Reinforcement Learning Meets Large Language Models: A Survey of Advancements and Applications Across the LLM Lifecycle” 的长文综述,系统性回顾了领域最新进展,深入探讨研究挑战并展望未来发展方向。
10/1/2025 10:51:00 AM
机器之心

Thinking Machines又发高质量博客:力推LoRA,不输全量微调

LoRA 在绝大多数后训练场景下,能以远低于全量微调的成本,获得几乎同等的效果。 Thinking Machines 将这一现象形容为 LoRA 的低遗憾区间(low-regret region)——即便不用全量微调,选择 LoRA 也不会让人后悔。 最近,Thinking Machines 真实高产啊。
9/30/2025 7:21:00 PM
机器之心

节前重磅:开源旗舰模型新SOTA,智谱GLM-4.6问世

新一代大模型的发布,都赶在了国庆假期前。 昨天,深度求索刚刚开源 DeepSeek-V3.2-Exp。 今天,另一国产大模型之光智谱 AI 也正式发布了旗下新一代旗舰模型 GLM-4.6,刚好撞车 Claude Sonnet 4.5。
9/30/2025 7:16:00 PM
机器之心

CAIR开源发布超声基座大模型EchoCare“聆音”,10余项医学任务性能登顶

2025年9月17日,中国科学院香港创新研究院人工智能与机器人创新中心(CAIR)在香港正式开源发布其最新科研成果——EchoCare“聆音”超声基座大模型(简称“聆音”)。 该模型基于超过450万张、涵盖50多个人体器官的大规模超声影像数据集训练而成,在器官识别、器官分割、病灶分类等10余项典型超声医学任务测试中表现卓越,性能全面登顶。 同时,“聆音”已在山东大学齐鲁医院、中南大学湘雅医院、香港中文大学医学院的多个超声检查领域完成3000多例临床回溯性验证,与当前SOTA(最优)模型相比,性能平均提高3%~5%。
9/30/2025 7:07:00 PM
机器之心

NeurIPS 2025 Spotlight | FSDrive统一VLA和世界模型,推动自动驾驶迈向视觉推理

面向自动驾驶的多模态大模型在 “推理链” 上多以文字或符号为中介,易造成空间 - 时间关系模糊与细粒度信息丢失。 FSDrive(FutureSightDrive)提出 “时空视觉 CoT”(Spatio-Temporal Chain-of-Thought),让模型直接 “以图思考”,用统一的未来图像帧作为中间推理步骤,联合未来场景与感知结果进行可视化推理。 该方法在不改动原有 MLLM 架构的前提下,通过 “词表扩展 自回归视觉生成” 激活图像生成能力,并以 “由易到难” 的渐进式视觉 CoT 注入物理先验。
9/30/2025 7:03:00 PM
机器之心

以赛促创新,推动具身智能机器人“真干活”,2025年第二届中关村具身智能机器人应用大赛火热报名中

在人形机器人与具身智能技术浪潮以迅猛之势席卷全球的当下,人形机器人如何落地成为社会关注的焦点。 9月以来,诸多聚焦落地的人形机器人订单接连达成,似乎为这一难题提供了解决方案,银河通用机器人经营的无人超市“银河太空舱”开张,该零售店成为商业场景下全球首个面向消费者常态化经营的具身智能落地场景;加速进化也宣布从球场走向家庭,将推出面向极客和教育场景的消费级机器人;优必选签署2.5亿元具身智能人形机器人产品及解决方案采购合同,直击工业场景的痛点需求;智平方与慧智物联达成战略合作,在未来三年内将部署超1000台具身智能机器人,覆盖从仓储物流、上下物料、零部件装配到质检测试等全流程;众擎机器人与多伦科技签署战略合作协议,计划在未来三年内采购不低于2000台具身智能人形机器人用于重点领域场景落地;星尘智能与仙工智能达成人形机器人千台级订单战略合作,预计在未来两年内推动上千台AI机器人在工业、制造、仓储、物流等场景大规模、分阶段部署。 这些商业化订单无疑揭示了人形机器人火热的现状,那么还有哪些真实场景人形机器人还有表现机会?
9/30/2025 10:39:00 AM
新闻助手

Claude Sonnet 4.5来了!能连续编程30多小时、1.1万行代码

十一假期还没开始,大模型又开始卷起来了! 昨天,DeepSeek 开源新模型 V3.2-Exp,深夜 Anthropic 也不甘人后,重磅发布 Claude Sonnet 4.5。 作为编程领域的王者,Claude 新模型依然强势,自称为世界上最好的编码模型。
9/30/2025 10:32:00 AM
机器之心

LLM工业级自进化:北邮与腾讯AI Lab提出MoE-CL架构,解决大模型持续学习核心痛点

在工业级大语言模型(LLM)应用中,动态适配任务与保留既有能力的 “自进化” 需求日益迫切。 真实场景中,不同领域语言模式差异显著,LLM 需在学习新场景合规规则的同时,不丢失旧场景的判断能力。 这正是大模型自进化核心诉求,即 “自主优化跨任务知识整合,适应动态环境而无需大量外部干预”。
9/30/2025 10:26:00 AM
机器之心

华为CloudMatrix384超节点支持DeepSeek-V3.2-Exp:第一时间上线

9 月 29 日,DeepSeek 发布并开源了最新一代大语言模型 DeepSeek-V3.2-Exp,引发了全网关注。 该模型引入稀疏 Attention 架构,这种架构能够有效降低计算资源消耗并提升模型推理效率。 与此同时,国内 AI 算力厂商也宣布对新模型实现了适配。
9/29/2025 11:21:00 PM
新闻助手

强强联手!深度求索、寒武纪同步发布DeepSeek-V3.2模型架构和基于vLLM的模型适配源代码

机器之心报道机器之心编辑部2025 年 9 月 29 日,深度求索公司发布新一代模型架构 DeepSeek-V3.2 ,引发行业广泛关注。 令人瞩目的是,在该大模型发布的同时,寒武纪也官宣了对 DeepSeek-V3.2 的适配,并开源大模型推理引擎 vLLM 源代码。 深度求索公司正式发布的 DeepSeek-V3.2-Exp 模型,是一个实验性(Experimental)的版本。
9/29/2025 7:17:00 PM
机器之心

刚刚,DeepSeek开源V3.2-Exp,公开新稀疏注意力机制DSA

还是熟悉的节奏! 在假期前一天,DeepSeek 果然搞事了。 刚刚,DeepSeek-V3.2-Exp 开源了!
9/29/2025 6:36:00 PM
机器之心

SALMONN 系列音视频理解大模型霸榜回归!推理增强、高帧率、无文本泄漏全线突破

SALMONN 家族在首个通用音频理解模型(ICLR 2024)和首个全要素音视频理解模型 video-SALMONN(ICML 2024)基础上再次迎来重磅扩容,霸榜各大音视频理解榜单! 全新一代 video-SALMONN 2/2 、首个开源推理增强型音视频理解大模型 video-SALMONN-o1(ICML 2025)、首个高帧率视频理解大模型 F-16(ICML 2025),以及无文本泄漏基准测试 AVUT(EMNLP 2025) 正式发布。 新阵容在视频理解能力与评测体系全线突破,全面巩固 SALMONN 家族在开源音视频理解大模型赛道的领先地位。
9/29/2025 3:20:00 PM
机器之心

首个零样本跨本体泛化开源具身模型:智源RoboBrain-X0 技术细节全解析

为具身智能行业提供了一个可复用、可扩展的通用基座,同时开源训练数据集。 今天,北京智源人工智能研究院(BAAI)正式开源 RoboBrain-X0,一个能够在零样本泛化、轻量微调条件下,驱动多种不同真实机器人完成复杂任务的具身智能基座大模型。 其核心突破在于:用统一的动作空间与分层任务拆解,实现了「一个基座模型,N种身体」,为通用具身智能提供一条切实可行的路径。
9/29/2025 3:11:00 PM
机器之心

腾讯混元3D-Omni:3D版ControlNet突破多模态控制,实现高精度3D资产生成

近年来,3D 原生生成模型在游戏、影视和设计领域的资产创建中展现出强大潜力。 然而,大多数现有方法仍主要依赖图像作为条件输入,缺乏细粒度、多模态的控制能力,限制了其在实际生产流程中的应用。 为解决这一瓶颈,腾讯混元团队推出了混元 3D-Omni,一个基于 Hunyuan3D 2.1 构建的统一多模态可控 3D 生成框架。
9/29/2025 3:05:00 PM
机器之心

云栖大会丨奇富科技费浩峻深度解构金融大模型四步破局路径

9月25日,在云栖大会“新‘模’力 新点金:金融大模型技术峰会”上,奇富科技首席算法科学家费浩峻基于公司丰富的落地实践经验,系统阐述了金融大模型的落地逻辑——告别参数规模的盲目追逐,以“做小做强”的路径推动金融AI从“堆人力、堆模型”的传统范式,迈向“聚智能、见个体”的价值升级,为行业提供了金融大模型务实落地的清晰样本。 费浩峻指出,在传统机器学习阶段,金融AI面临两大核心制约:一是高度依赖人工特征工程,模型难以直接处理真实世界中复杂、非结构化的数据;二是模型泛化能力差,不同业务需定制不同模型,迭代成本高、响应慢。 面对这些挑战,奇富科技围绕金融大模型技术形成四大破局点:第一步,一模型多能,打破泛化瓶颈。
9/29/2025 3:05:00 PM
新闻助手

GPT-5解决量子版NP难题?半小时内给出有效方案

编辑丨%量子计算听起来就很烧脑了,但在理论世界里还有一群人,他们专门研究「量子证明」能做到什么程度。 这个领域叫量子复杂性理论,其中很出名的一个类是 QMA ——它是「量子版的NP问题」,可以理解成:有一个「量子证明」,由验证者用量子计算机来检查真假。 过去二十年,研究者不断尝试把验证错误率压得越来越低,就像玩游戏要刷「满暴击率」。
9/29/2025 2:04:00 PM
ScienceAI

在具身智能的岔路口,这场论坛把数据、模型、Infra聊透了

当机器人成为各大科技展会最受瞩目的焦点,当具身智能论坛场场爆满、一票难求,我们不难发现:这个领域正在经历前所未有的关注热潮。 然而,热潮之下,仍有诸多关键议题悬而未决:面对数据稀缺,有人寄希望于合成数据的突破,有人坚持真机数据才是根本;在技术路线之争中,有人押注端到端的整体范式,有人则认为分层架构更符合演进规律;至于模型形态,有人视 VLA 为智能的最终归宿,也有人认为世界模型才是真正的未来。 现阶段出现这种分歧非常正常,因为整个行业的发展路径尚未收敛。
9/29/2025 11:40:00 AM
机器之心