上海交通大学
学术打假!清华上交大研究颠覆认知:强化学习竟是大模型推理的"绊脚石"
【研究颠覆】清华大学与上海交通大学联合发表的最新论文,对业界普遍认为"纯强化学习(RL)能提升大模型推理能力"的观点提出了挑战性反驳。 研究发现,引入强化学习的模型在某些任务中的表现,反而逊色于未使用强化学习的原始模型。 【实验验证】研究团队在数学、编码和视觉推理三大领域进行了系统性实验:数学任务:在GSM8K、MATH500等基准测试中,RL模型在低采样次数(k值)下准确率提升,但在高k值时问题覆盖率显著下降编码任务:RLVR训练模型在HumanEval 等测试中单样本pass@1分数提高,但在高采样数(k=128)时覆盖率下降视觉推理:Qwen-2.5-VL-7B模型在多模态任务中表现一致,RL未改变其基本问题解决策略【学界争议】研究结果引发学界激烈讨论:支持方认为RL提高了采样效率但限制了推理能力开发反对方指出可能是奖励结构缺陷而非RL本身问题中立观点建议结合蒸馏等其他方法增强推理【本质思考】研究团队提出关键区分:能力:模型解决问题的潜质与逻辑链条效率:在给定能力范围内得出答案的速度与稳定性强化学习更像是"能力调控器"而非"能力创造器",它能让模型更擅长做已知的事,但难以开发新的推理路径。
4/23/2025 2:00:43 PM
AI在线
上海交大今年增加 150 名本科招生名额,扩招 AI、集成电路等学科
据上海交通大学公众号消息,2025年,学校将继续增加150名本科招生名额,重点面向国家急需的前沿技术和新兴业态,扩大人工智能、集成电路、生物医药、医疗健康、新能源等学科领域的招生规模。
3/5/2025 9:17:14 PM
清源
上海交大联合开发 AI 系统,首次实现孕前精准预测流产风险
本月发表的最新论文中,上海交通大学李金金教授领导的研究团队开发了可解释 AI 算法,搭建流产风险预警平台,通过分析血清代谢物,首次实现在怀孕前精准预测流产风险。项目团队简介该项目团队由上海交通大学李金金教授领导,携手上海市红房子妇产科医院金莉萍副院长,同济大学附属第一妇婴医院、上海交通大学医学院附属瑞金医院共同参与开发。论文标题为《Interpretable learning predicts miscarriage using pre-pregnancy serum metabolites》,于 10 月发表在《The Innovation Medicine》期刊上。
10/12/2024 9:51:23 AM
故渊
CVPR 2024 | 打破黑白边界,融合美学与实用性的二维码生成技术来了
图表 1第一行:对于同一个二维码,我们可以提供不同美化风格的支持。第二行:放大图像的细节,可以看到我们的算法能得到细节丰富且自然的美学二维码。在数字世界与物理世界无缝连接的今天,二维码(QR codes)已经成为了连接这两个领域的重要桥梁。这种二维编码方式广泛应用于各类场景中,从广告到支付,再到信息传递,几乎无处不在。然而,尽管二维码在功能上表现出色,但它的外观却相对单调,通常以黑白方块为主,难以与现代视觉美学相契合。随着用户和行业需求的不断变化,越来越多的人希望二维码不仅能够高效传递信息,还能具有视觉上的吸引力。
9/19/2024 4:09:00 PM
新闻助手
首个开源、原生多模态生成大模型:一键生成 「煎鸡蛋」图文菜谱
AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报道。投稿邮箱:[email protected];[email protected]生成式人工智能研究实验室(GAIR,主页:)由上海交通大学刘鹏飞副教授2023年4月回国创建,是国内首个聚焦于生成式人工智能的高校研究组。汇聚了来自于CMU、复旦、交大(ACM班、IEEE
7/4/2024 6:33:00 PM
机器之心
上海交大卢策吾:具身智能与他的首个刮胡子机器人 | 智者访谈
查阅历史资料后表明,上海交通大学的卢策吾教授是世界上第一个被机器人用刀片刮胡子的人。视频展示了上海交通大学卢策吾教授亲自体验其团队研发成果的过程——在一个具身智能大模型操控下,机械臂完成了刮胡子的动作。机器人给人刮胡子,看似简单,实则蕴含巨大挑战,除了行为泛化性,更重要的是需要极致鲁棒性。可以看到,当卢教授的头部移动时,这个嵌入了高精度力反馈模块的具身智能大模型能够瞬时决策压力和切向力的变化,既把胡须刮干净,又不会伤到他。如果大模型仅通过视觉判定轨迹输出,将难以完成任务。这也无法通过遥操作实现。在大模型风靡的 20
6/3/2024 3:31:00 PM
机器之心
大模型也有小偷?为保护你的参数,上交大给大模型制作「人类可读指纹」
将不同的基模型象征为不同品种的狗,其中相同的「狗形指纹」表明它们源自同一个基模型。大模型的预训练需要耗费巨量的计算资源和数据,因而预训练模型的参数也正成为各大机构重点保护的核心竞争力和资产。然而,不同于传统的软件知识产权保护可以通过比对源代码来确认是否存在代码盗用,对预训练模型参数盗用的判断存在以下两方面的新问题:1) 预训练模型的参数,尤其是千亿级别模型的参数,通常不会开源。2) 更重要的是,预训练模型的输出和参数都会随着 SFT、RLHF、continue pretraining 等下游处理步骤而变化。这使得无
2/2/2024 5:18:00 PM
机器之心
上海交大团队利用深度学习进行运动评估,促进脑瘫早期筛查
编辑 | 白菜叶Prechtl 全身运动评估 (GMA) 因其在评估神经系统发育完整性和预测运动功能障碍方面的作用而日益得到认可,特别是在脑瘫 (CP) 等疾病中。然而,对训练有素的专业人员的需求,阻碍了一些国家采用 GMA 作为早期筛查工具。在最新的研究中,上海交通大学的研究人员提出了一种基于深度学习的运动评估模型(MAM),该模型结合了婴儿视频和基本特征,旨在在烦躁运动(FM)阶段实现 GMA 自动化。MAM 表现出强大的性能,在外部验证期间实现了 0.967 的曲线下面积 (AUC)。重要的是,它严格遵循 G
12/15/2023 3:59:00 PM
ScienceAI
- 1
资讯热榜
标签云
人工智能
OpenAI
AIGC
AI
ChatGPT
AI绘画
DeepSeek
数据
模型
机器人
谷歌
大模型
Midjourney
智能
用户
开源
学习
GPT
微软
Meta
图像
AI创作
技术
论文
Gemini
Stable Diffusion
马斯克
算法
蛋白质
芯片
代码
生成式
英伟达
腾讯
神经网络
研究
计算
Anthropic
3D
Sora
AI for Science
AI设计
机器学习
开发者
GPU
AI视频
华为
场景
人形机器人
预测
百度
苹果
伟达
Transformer
深度学习
xAI
Claude
模态
字节跳动
大语言模型
搜索
驾驶
具身智能
神器推荐
文本
Copilot
LLaMA
算力
安全
视觉
视频生成
训练
干货合集
应用
大型语言模型
亚马逊
科技
智能体
AGI
DeepMind