ICML 2025
给大模型「精准手术」:美团智能客服提出逆向学习技术精准纠偏,风险控制提升38%
美团智能客服最新研究,提出了一种逆向学习新技术(简称 “逆学习”),能像 “精准手术” 一样,安全、高效地抑制模型中的特定错误和风险行为,在关键风险控制指标上提升 38 个百分点以上的同时,保障整体服务效果不下降,有效提升用户体验。 ”背景:智能客服场景下的数据回流方案美团智能客服采用的端到端大模型智能体,结合数据回流机制,构建了一套从线上服务中自动收集、筛选并利用真实对话数据的闭环优化方案。 该方案能够持续从用户交互中挖掘优质应答样本(Good Case)与问题样本(Bad Case),显著提升了模型的指令遵循能力、表达自然度和复杂状态推理性能,在多项业务场景中实现了综合问题解决率的有效增长。
9/19/2025 6:59:00 PM
机器之心
ICML 2025 | 作业帮团队提出基于能量的偏好模型(EBM),攻克LLM对齐痛点,性能超越主流方法
在大模型(LLM)通过人类反馈进行对齐(RLHF)的过程中,核心的偏好建模方法Bradley-Terry模型(BTM)存在固有理论缺陷,导致模型训练不稳定、效果受限,甚至引发安全隐患。 来自作业帮教育科技(北京)有限公司的研究团队,在ICML 2025上提出了一种基于能量的新型偏好模型(EBM),名为无限偏好模型(IPM),并基于此设计了实用的能量偏好对齐(EPA)损失函数。 理论分析和大量实验表明,该方法从根本上解决了BTM的缺陷,在多个关键指标上显著超越DPO、IPO、KTO等主流离线对齐方法,为构建更稳定、更可靠、更安全的AI系统提供了新路径。
8/26/2025 5:17:00 PM
新闻资讯
多模态大模型,真的「懂」世界吗?——揭秘 MLLM 的核心知识缺陷
f然而,如果你仔细观察,就会发现一个的事实:它们在一些看似简单、直观、人类幼儿都能轻松完成的任务中,却频频「翻车」。 比如,「一个玩具被遮住后还在吗? 」、「液体倒入不同形状容器后,体积变了吗?
7/28/2025 11:10:00 AM
机器之心
ICML 2025 | CoTo:让LoRA训练「渐入佳境」,模型融合、剪枝样样精通
本文第一作者庄湛,香港城市大学和南方科技大学联合培养博士生,研究方向是迁移学习、扩散模型、大模型微调等。 本文通讯作者魏颖,浙江大学「百人计划」研究员,博士生导师,研究方向包括持续学习、迁移学习、组合泛化以及在科学领域中的应用等。 通讯作者张宇,南方科技大学副教授,研究方向包括深度学习、多任务学习、迁移学习、元学习以及在计算机视觉和自然语言处理方面的应用。
7/26/2025 11:02:00 PM
机器之心
ICML 2025 | 大模型能在信息不完备的情况下问出正确的问题吗?
大语言模型(Large Language Model, LLM)在复杂推理任务中表现卓越。 借助链式思维(Chain-of-Thought, CoT),LLM 能够将复杂问题分解为简单步骤,充分探索解题思路并得出正确答案。 LLM 已在多个基准上展现出优异的推理能力,尤其是数学推理和代码生成。
7/24/2025 1:15:00 PM
机器之心
ICML 2025 | 质量更高、噪声更低、生物信号更强,东京大学&麦吉尔大学提出空间转录组数据建模新方法SUICA
作者 | 论文团队编辑 | ScienceAI空间转录组(Spatial Transcriptomics, ST)数据是在同一张组织切片上同步记录「基因表达量」和「空间坐标」的高维信息矩阵。 近期,东京大学郑银强老师组、麦吉尔大学丁俊老师组共同提出了一种针对空间转录组数据建模的方法 SUICA。 相关成果以《Suica: Learning super-high dimensional sparse implicit neural representations for spatial transcriptomics》为题,入选 ICML 2025。
7/21/2025 11:51:00 AM
ScienceAI
ICML 2025|多模态理解与生成最新进展:港科联合SnapResearch发布ThinkDiff,为扩散模型装上大脑
本文第一作者密振兴,香港科技大学计算机科学与技术学院人工智能方向博士生,研究方向是多模态理解与生成,3D/4D 重建与生成,目前正在寻找工业界全职职位或实习职位。 自 Stable Diffusion、Flux 等扩散模型 (Diffusion models) 席卷图像生成领域以来,文本到图像的生成技术取得了长足进步。 但它们往往只能根据精确的文字或图片提示作图,缺乏真正读懂图像与文本、在多模 态上下文中推理并创作的能力。
7/16/2025 12:50:00 PM
机器之心
ICML 2025杰出论文出炉:8篇获奖,南大研究者榜上有名
包括 6 篇杰出论文奖和 2 篇杰出立场论文奖。 本周一,ICML 2025 公布了最佳论文奖项。 今年获奖论文共计 8 篇,其中包括 6 篇杰出论文奖和 2 篇杰出立场论文奖。
7/15/2025 2:54:00 PM
机器之心
ICML 2025 | M+框架来了,增加LLM隐空间记忆,不再受上下文窗口限制
本文的第一作者Yu Wang来自加州大学圣地亚哥分校,主要研究方向为Memory for LLMs and Memory for LLM Agents. 该论文于2024年在MIT-IBM Waston Lab实习过程中完成,通讯作者Zexue He也毕业于加州大学圣地亚哥分校。 M 是在 MemoryLLM 之上提出的长期隐空间记忆扩展框架:通过把「过期」隐藏向量写入 CPU - 侧长期记忆池,再用协同检索器拉回最相关记忆,它将 8 B 级模型的有效记忆跨度从原本不到 20 k tokens 提升到 160 k tokens 以上,同时显存占用保持不变。
7/15/2025 11:42:00 AM
机器之心
ICML 2025,相约加拿大温哥华!机器之心免费请你吃饭
作为 AI 领域最具影响力的学术会议之一,今年 ICML 将于 7 月 13 日至 7 月 19 日在加拿大温哥华会议中心举行。 在高强度的会议日程之外,不妨为自己预留一些时间,参与一场更轻松、更自由的线下交流活动 ——7 月 15 日「云帆・ICML 2025 AI Talent Meetup」期待您的到来。 这是机器之心与上海人工智能实验室、东方菁汇、全球高校人工智能学术联盟共同攒的饭局,旨在为企业和人才搭建沟通桥梁。
7/11/2025 8:30:00 PM
机器之心
ICML 2025 | 清华、上海AI Lab提出专家级医学基准MedXpertQA,看o3、R1哪家强
本文作者来自于清华大学和上海 AI Lab,通讯作者为清华大学丁宁助理教授和清华大学讲席教授、上海 AI Lab 主任周伯文教授。 论文标题:MedXpertQA: Benchmarking Expert-Level Medical Reasoning and Understanding论文:: : ICML 2025 接收,并且被 DeepMind MedGemma 采用为评估基准。 基准地址:?
7/8/2025 1:01:00 PM
机器之心
ICML 2025 | 多智能体的ChatGPT时刻?上交MAS-GPT实现工作流一键生成
本文第一作者叶锐,上海交通大学博士三年级,研究方向是大模型多智能体,联邦学习,博士导师陈思衡,上海交通大学人工智能学院副教授。 OpenAI 将 “组织级智能 (Organizational AI)” 设定为通向 AGI 的第五个重要阶段 —— 期待 AI 能像一个高效协作的组织那样,处理复杂任务并协调大规模运作。 多智能体系统(Multi-Agent Systems, MAS)正是实现这一目标的重要探索方向。
7/5/2025 6:29:00 PM
机器之心
- 1
资讯热榜
全新开源的DeepSeek-OCR,可能是最近最惊喜的模型!
刚刚,ChatGPT终于可以走遍整个互联网了!OpenAI深夜炸街:原生ChatGPT集成、即时理解、主动执行,浏览器赛道鲨疯了
告别抽卡!Vidu Q2多图参考生视频功能重磅上线
最强OCR竟然不是DeepSeek、Paddle!HuggingFace新作:六大顶尖开源OCR模型横评!继DS后又杀出匹黑马!
OpenAI首款ChatGPT浏览器发布!现在就能免费下载使用
保姆级教程!教你用Coze工作流2分钟生成优质文章
通义千问再放大招!Qwen3-VL 家族新增 2B 与 32B 模型,开源矩阵全面升级
OpenAI、Oracle 再加码 AI 基建:150亿美元 Lighthouse 园区启动建设
标签云
AI
人工智能
OpenAI
AIGC
模型
ChatGPT
DeepSeek
谷歌
AI绘画
机器人
数据
大模型
Midjourney
开源
Meta
智能
微软
用户
AI新词
GPT
学习
技术
智能体
马斯克
Gemini
图像
Anthropic
英伟达
AI创作
训练
LLM
论文
代码
算法
芯片
AI for Science
腾讯
Stable Diffusion
Agent
苹果
Claude
蛋白质
开发者
生成式
神经网络
xAI
机器学习
3D
人形机器人
研究
AI视频
生成
RAG
大语言模型
Sora
百度
具身智能
工具
GPU
华为
计算
字节跳动
AI设计
搜索
大型语言模型
AGI
视频生成
场景
深度学习
DeepMind
架构
生成式AI
视觉
编程
预测
Transformer
AI模型
伟达
特斯拉
Copilot