清华大学
RL 将如何提高具身大模型 VLA 泛化性?清华大学团队NeurIPS 2025文章分析 RL 与 SFT 泛化性差异
在具身智能领域,视觉 - 语言 - 动作(VLA)大模型正展现出巨大潜力,但仍面临一个关键挑战:当前主流的有监督微调(SFT)训练方式,往往让模型在遇到新环境或任务时容易出错,难以真正做到类人般的泛化。 但在大语言模型(LLM/VLM)领域,强化学习(RL)已被证明能显著提升模型的泛化能力。 RL 究竟能为 VLA 带来哪些独特的泛化优势?
10/12/2025 3:44:00 PM
机器之心
2025大模型服务性能排行榜:PPIO吞吐测试排名第一
9 月 13 日,在 GOSIM2025 大会上,清华大学携手中国软件评测中心联合发布了《2025 大模型服务性能排行榜》,PPIO 在 DeepSeek-R1-0528的吞吐测试中排名第一。 该榜单从延迟、吞吐、可靠性等关键指标切入,由专业团队通过长周期、高频率、多时段的数据评测,直观呈现不同MaaS供应商的服务表现。 而且,平台以匿名用户身份对 MaaS(Model as a Service)平台开展产品端到端的性能测评,从评测主体与流程上双重保障了客观公正性。
9/16/2025 5:23:02 PM
量子位的朋友们
清华大学唯一持股具身智能企业“星动纪元”完成近 5 亿元 A 轮融资
AI在线 7 月 7 日消息,星动纪元今日宣布完成近 5 亿元 A 轮融资。 本轮融资由鼎晖 VGC 和海尔资本联合领投,厚雪资本、华映资本、襄禾资本、丰立智能等知名财务机构及产业资本跟投,老股东清流资本、清控基金等机构持续加码。 华兴资本担任本轮独家财务顾问。
7/7/2025 12:43:12 PM
归泷
腾讯公益首次引入AI大模型,提升公益项目互动体验
近日,腾讯公益正式推出了 “问 AI” 功能,这是该平台首次将大型人工智能模型应用于公益领域。 这项创新的功能允许用户就腾讯公益的各类项目和机构进行提问,旨在提升公众与公益组织之间的互动和透明度。 “问 AI” 功能的上线,标志着腾讯在公益事业上的又一次突破。
6/5/2025 11:00:56 AM
AI在线
华为、清华大学合作打造首个园区网络智能体:17 万终端全方位覆盖,一句话定位问题、自动优化 Wi-Fi
与清华本地部署的 DeepSeek 深度协同,智能体自主处置网络故障,推动网络运维从“被动应对”跃入“自动驾驶”新时代。
5/7/2025 7:13:17 PM
汪淼
清华大学成立人工智能医院,培育新一代“AI 协同型医生”
清华大学人工智能医院揭牌清华大学人工智能医院(IT之家注:Tsinghua AI Agent Hospital)建设将分阶段进行,初期将在学校 AI 全面布局和多学科医工交叉的基础上建设 AI 医院系统,依托北京清华长庚医院及北京清华长庚互联网医院试运行,以全科医学科和眼科、放射诊断科、呼吸科等专科为试点。
4/28/2025 6:49:33 AM
汪淼
清华大学成立人工智能医院 迈向智慧医疗新篇章
清华大学正式成立人工智能医院,标志着该校在 “AI 医疗” 领域迈出了重要一步。 4月26日,清华大学举行了人工智能医院的揭牌仪式,并在医学院全体教职工大会上进行了相关介绍。 校长李路明、副校长王宏伟等多位领导出席了此次仪式,共同见证了这一历史性时刻。
4/27/2025 2:00:49 PM
AI在线
学术打假!清华上交大研究颠覆认知:强化学习竟是大模型推理的"绊脚石"
【研究颠覆】清华大学与上海交通大学联合发表的最新论文,对业界普遍认为"纯强化学习(RL)能提升大模型推理能力"的观点提出了挑战性反驳。 研究发现,引入强化学习的模型在某些任务中的表现,反而逊色于未使用强化学习的原始模型。 【实验验证】研究团队在数学、编码和视觉推理三大领域进行了系统性实验:数学任务:在GSM8K、MATH500等基准测试中,RL模型在低采样次数(k值)下准确率提升,但在高k值时问题覆盖率显著下降编码任务:RLVR训练模型在HumanEval 等测试中单样本pass@1分数提高,但在高采样数(k=128)时覆盖率下降视觉推理:Qwen-2.5-VL-7B模型在多模态任务中表现一致,RL未改变其基本问题解决策略【学界争议】研究结果引发学界激烈讨论:支持方认为RL提高了采样效率但限制了推理能力开发反对方指出可能是奖励结构缺陷而非RL本身问题中立观点建议结合蒸馏等其他方法增强推理【本质思考】研究团队提出关键区分:能力:模型解决问题的潜质与逻辑链条效率:在给定能力范围内得出答案的速度与稳定性强化学习更像是"能力调控器"而非"能力创造器",它能让模型更擅长做已知的事,但难以开发新的推理路径。
4/23/2025 2:00:43 PM
AI在线
清华大学推出全新 AI 辅修学位,助力学科交叉创新
根据最新消息,清华大学在经历了适度扩招和新书院的成立后,将于今年秋季学期推出一项全新的 AI 辅修学位。 这一举措旨在吸引有志于将人工智能与各自学科相结合的学生,通过系统的课程设置,帮助他们掌握 AI 相关的知识和技能。 图源备注:图片由AI生成,图片授权服务商Midjourney新设的 AI 辅修学位将对校内所有有意愿探索学科与人工智能交叉领域的学生开放。
4/14/2025 2:01:07 PM
AI在线
清华大学今年秋季学期起将推出 AI 辅修学位
继今年 3 月清华大学宣布适度扩招、成立新书院后,学校教学委员会近期审议通过了 AI 辅修学位培养方案,决定今年秋季学期起推出新的 AI 辅修学位。
4/14/2025 11:48:18 AM
清源
清华-腾讯人工智能通识公益课程落地 200 余所乡村小学
据“企鹅支教”公众号消息,近日,清华大学计算机系 AIGE 研究中心与腾讯可持续社会价值事业部(SSV)数字支教实验室合作的人工智能通识公益课程在企鹅支教平台上线。
3/31/2025 7:19:45 AM
浩渺
清华团队开源大模型推理引擎“赤兔 Chitu”,实现 DeepSeek 推理成本降低一半、性能翻番
官方表示,当前开源的赤兔引擎在部署DeepSeek-R1-671B满血版时,在A800集群的测试中,相比部分国外开源框架,实现了GPU使用量减少50%的同时,推理速度的3.15倍提升。
3/14/2025 8:06:51 PM
清源
清华大学 2025 年将适度扩招本科生,重点培养“AI+”拔尖创新人才
据新华社报道,从清华大学获悉,为服务国家战略需求和社会发展需要,该校计划在 2025 年有序扩大本科招生规模,新增约 150 个本科生招生名额。同时,清华大学将成立新的本科通识书院,旨在培养人工智能与多学科交叉的复合型人才。据悉,该校新增本科生将进入新成立的书院学习。
3/2/2025 3:31:13 PM
远洋
清华大学AIR联合水木分子开源DeepSeek版多模态生物医药大模型BioMedGPT-R1
编辑 | ScienceAI2025 年初,DeepSeek给全球引发了 AI 大模型的新一轮热议。 多家市场咨询公司指出,在 DeepSeek 的影响下,从大模型供应商到基础设施和平台供应商的整个 AI 产业生态都掀起了一波「新浪潮」。 DeepSeek R1 以其强大的推理能力,为各行各业带来了智能化升级新机遇。
2/21/2025 4:03:00 PM
ScienceAI
ICLR 2025 | Diffusion Planner: 基于扩散模型的自动驾驶规划算法,nuPlan SOTA!
本文介绍了清华大学联合毫末智行、自动化所、港中文、上海交大、上海人工智能实验室的发表于ICLR 2025的最新研究成果《Diffusion-based Planning for Autonomous Driving with Flexible Guidance》。 该算法创新性地设计了基于 Diffusion Transformer 的自动驾驶规划模型架构,高效处理复杂场景输入,并联合建模周车运动预测与自车规划中的多模态驾驶行为,充分发挥扩散模型在闭环规划中的潜力,解决了现有基于学习的规划方法对后处理的严重依赖问题。 此外,借助扩散模型的引导机制,模型在部署阶段能够灵活适应不同的驾驶需求,提高泛化能力与实用性。
2/10/2025 11:01:00 AM
新闻助手
清华团队 AI 光学计算新突破:光谱卷积神经网络芯片,数据吞吐量降低了96%!
编辑 | 2049近年来,人工智能技术在各个领域的广泛应用对计算效率提出了更高要求。 特别是在边缘计算场景中,如何降低深度学习模型的计算成本和功耗成为关键挑战。 来自清华大学的研究团队提出了一种创新的光谱卷积神经网络(Spectral Convolutional Neural Network,SCNN)芯片架构,通过将光学计算与电子计算相结合,实现了无相干自然光的片上边缘计算。
2/5/2025 2:32:00 PM
ScienceAI
清北团队进军具身智能,银河通用、灵初智能、星海图齐发力
具身智能创业如火如荼,技术路线是否收敛、以及数据来源的选择,都是大家一直关心的问题。 最近清华北大的团队密集发布了很多研究成果,我们或许可以从中分析出一些趋势。 23 年初成立的银河通用背后是前如布科技联创尹方鸣和姚腾洲、科学家是北大助理教授王鹤。
1/21/2025 11:00:00 AM
新闻助手
月之暗面 Kimi 联合清华大学等开源大模型推理架构 Mooncake
本次开源将采用分阶段的方式,逐步开源高性能 KVCache 多级缓存 Mooncake Store 的实现,同时针对各类推理引擎和底层存储 / 传输资源进行兼容。
11/28/2024 1:06:19 PM
汪淼
资讯热榜
标签云
AI
人工智能
OpenAI
AIGC
模型
ChatGPT
DeepSeek
谷歌
AI绘画
机器人
数据
大模型
Midjourney
开源
Meta
智能
微软
用户
AI新词
GPT
学习
技术
智能体
马斯克
Gemini
图像
Anthropic
英伟达
AI创作
训练
论文
代码
LLM
算法
Stable Diffusion
芯片
腾讯
苹果
AI for Science
Agent
Claude
蛋白质
开发者
生成式
神经网络
xAI
机器学习
3D
研究
人形机器人
生成
AI视频
百度
工具
RAG
大语言模型
Sora
华为
GPU
计算
具身智能
AI设计
字节跳动
搜索
大型语言模型
AGI
场景
深度学习
视频生成
架构
预测
视觉
伟达
DeepMind
Transformer
编程
神器推荐
AI模型
亚马逊
Copilot