ICML 2025
给大模型「精准手术」:美团智能客服提出逆向学习技术精准纠偏,风险控制提升38%
美团智能客服最新研究,提出了一种逆向学习新技术(简称 “逆学习”),能像 “精准手术” 一样,安全、高效地抑制模型中的特定错误和风险行为,在关键风险控制指标上提升 38 个百分点以上的同时,保障整体服务效果不下降,有效提升用户体验。 ”背景:智能客服场景下的数据回流方案美团智能客服采用的端到端大模型智能体,结合数据回流机制,构建了一套从线上服务中自动收集、筛选并利用真实对话数据的闭环优化方案。 该方案能够持续从用户交互中挖掘优质应答样本(Good Case)与问题样本(Bad Case),显著提升了模型的指令遵循能力、表达自然度和复杂状态推理性能,在多项业务场景中实现了综合问题解决率的有效增长。
9/19/2025 6:59:00 PM
机器之心
ICML 2025 | 作业帮团队提出基于能量的偏好模型(EBM),攻克LLM对齐痛点,性能超越主流方法
在大模型(LLM)通过人类反馈进行对齐(RLHF)的过程中,核心的偏好建模方法Bradley-Terry模型(BTM)存在固有理论缺陷,导致模型训练不稳定、效果受限,甚至引发安全隐患。 来自作业帮教育科技(北京)有限公司的研究团队,在ICML 2025上提出了一种基于能量的新型偏好模型(EBM),名为无限偏好模型(IPM),并基于此设计了实用的能量偏好对齐(EPA)损失函数。 理论分析和大量实验表明,该方法从根本上解决了BTM的缺陷,在多个关键指标上显著超越DPO、IPO、KTO等主流离线对齐方法,为构建更稳定、更可靠、更安全的AI系统提供了新路径。
8/26/2025 5:17:00 PM
新闻资讯
多模态大模型,真的「懂」世界吗?——揭秘 MLLM 的核心知识缺陷
f然而,如果你仔细观察,就会发现一个的事实:它们在一些看似简单、直观、人类幼儿都能轻松完成的任务中,却频频「翻车」。 比如,「一个玩具被遮住后还在吗? 」、「液体倒入不同形状容器后,体积变了吗?
7/28/2025 11:10:00 AM
机器之心
ICML 2025 | CoTo:让LoRA训练「渐入佳境」,模型融合、剪枝样样精通
本文第一作者庄湛,香港城市大学和南方科技大学联合培养博士生,研究方向是迁移学习、扩散模型、大模型微调等。 本文通讯作者魏颖,浙江大学「百人计划」研究员,博士生导师,研究方向包括持续学习、迁移学习、组合泛化以及在科学领域中的应用等。 通讯作者张宇,南方科技大学副教授,研究方向包括深度学习、多任务学习、迁移学习、元学习以及在计算机视觉和自然语言处理方面的应用。
7/26/2025 11:02:00 PM
机器之心
ICML 2025 | 大模型能在信息不完备的情况下问出正确的问题吗?
大语言模型(Large Language Model, LLM)在复杂推理任务中表现卓越。 借助链式思维(Chain-of-Thought, CoT),LLM 能够将复杂问题分解为简单步骤,充分探索解题思路并得出正确答案。 LLM 已在多个基准上展现出优异的推理能力,尤其是数学推理和代码生成。
7/24/2025 1:15:00 PM
机器之心
ICML 2025 | 质量更高、噪声更低、生物信号更强,东京大学&麦吉尔大学提出空间转录组数据建模新方法SUICA
作者 | 论文团队编辑 | ScienceAI空间转录组(Spatial Transcriptomics, ST)数据是在同一张组织切片上同步记录「基因表达量」和「空间坐标」的高维信息矩阵。 近期,东京大学郑银强老师组、麦吉尔大学丁俊老师组共同提出了一种针对空间转录组数据建模的方法 SUICA。 相关成果以《Suica: Learning super-high dimensional sparse implicit neural representations for spatial transcriptomics》为题,入选 ICML 2025。
7/21/2025 11:51:00 AM
ScienceAI
ICML 2025|多模态理解与生成最新进展:港科联合SnapResearch发布ThinkDiff,为扩散模型装上大脑
本文第一作者密振兴,香港科技大学计算机科学与技术学院人工智能方向博士生,研究方向是多模态理解与生成,3D/4D 重建与生成,目前正在寻找工业界全职职位或实习职位。 自 Stable Diffusion、Flux 等扩散模型 (Diffusion models) 席卷图像生成领域以来,文本到图像的生成技术取得了长足进步。 但它们往往只能根据精确的文字或图片提示作图,缺乏真正读懂图像与文本、在多模 态上下文中推理并创作的能力。
7/16/2025 12:50:00 PM
机器之心
ICML 2025杰出论文出炉:8篇获奖,南大研究者榜上有名
包括 6 篇杰出论文奖和 2 篇杰出立场论文奖。 本周一,ICML 2025 公布了最佳论文奖项。 今年获奖论文共计 8 篇,其中包括 6 篇杰出论文奖和 2 篇杰出立场论文奖。
7/15/2025 2:54:00 PM
机器之心
ICML 2025 | M+框架来了,增加LLM隐空间记忆,不再受上下文窗口限制
本文的第一作者Yu Wang来自加州大学圣地亚哥分校,主要研究方向为Memory for LLMs and Memory for LLM Agents. 该论文于2024年在MIT-IBM Waston Lab实习过程中完成,通讯作者Zexue He也毕业于加州大学圣地亚哥分校。 M 是在 MemoryLLM 之上提出的长期隐空间记忆扩展框架:通过把「过期」隐藏向量写入 CPU - 侧长期记忆池,再用协同检索器拉回最相关记忆,它将 8 B 级模型的有效记忆跨度从原本不到 20 k tokens 提升到 160 k tokens 以上,同时显存占用保持不变。
7/15/2025 11:42:00 AM
机器之心
ICML 2025,相约加拿大温哥华!机器之心免费请你吃饭
作为 AI 领域最具影响力的学术会议之一,今年 ICML 将于 7 月 13 日至 7 月 19 日在加拿大温哥华会议中心举行。 在高强度的会议日程之外,不妨为自己预留一些时间,参与一场更轻松、更自由的线下交流活动 ——7 月 15 日「云帆・ICML 2025 AI Talent Meetup」期待您的到来。 这是机器之心与上海人工智能实验室、东方菁汇、全球高校人工智能学术联盟共同攒的饭局,旨在为企业和人才搭建沟通桥梁。
7/11/2025 8:30:00 PM
机器之心
ICML 2025 | 清华、上海AI Lab提出专家级医学基准MedXpertQA,看o3、R1哪家强
本文作者来自于清华大学和上海 AI Lab,通讯作者为清华大学丁宁助理教授和清华大学讲席教授、上海 AI Lab 主任周伯文教授。 论文标题:MedXpertQA: Benchmarking Expert-Level Medical Reasoning and Understanding论文:: : ICML 2025 接收,并且被 DeepMind MedGemma 采用为评估基准。 基准地址:?
7/8/2025 1:01:00 PM
机器之心
ICML 2025 | 多智能体的ChatGPT时刻?上交MAS-GPT实现工作流一键生成
本文第一作者叶锐,上海交通大学博士三年级,研究方向是大模型多智能体,联邦学习,博士导师陈思衡,上海交通大学人工智能学院副教授。 OpenAI 将 “组织级智能 (Organizational AI)” 设定为通向 AGI 的第五个重要阶段 —— 期待 AI 能像一个高效协作的组织那样,处理复杂任务并协调大规模运作。 多智能体系统(Multi-Agent Systems, MAS)正是实现这一目标的重要探索方向。
7/5/2025 6:29:00 PM
机器之心
资讯热榜
标签云
AI
人工智能
OpenAI
AIGC
模型
ChatGPT
谷歌
DeepSeek
AI绘画
大模型
机器人
数据
AI新词
Midjourney
开源
Meta
微软
智能
用户
GPT
学习
技术
智能体
Gemini
马斯克
Anthropic
英伟达
图像
AI创作
训练
LLM
论文
代码
算法
苹果
AI for Science
Agent
Claude
腾讯
芯片
Stable Diffusion
蛋白质
具身智能
开发者
xAI
生成式
神经网络
机器学习
3D
人形机器人
AI视频
RAG
大语言模型
研究
百度
Sora
生成
GPU
工具
华为
字节跳动
计算
AGI
大型语言模型
AI设计
搜索
生成式AI
视频生成
DeepMind
特斯拉
场景
AI模型
深度学习
亚马逊
架构
Transformer
MCP
编程
视觉
预测