ICML 2025
多模态大模型,真的「懂」世界吗?——揭秘 MLLM 的核心知识缺陷
f然而,如果你仔细观察,就会发现一个的事实:它们在一些看似简单、直观、人类幼儿都能轻松完成的任务中,却频频「翻车」。 比如,「一个玩具被遮住后还在吗? 」、「液体倒入不同形状容器后,体积变了吗?
7/28/2025 11:10:00 AM
机器之心
ICML 2025 | CoTo:让LoRA训练「渐入佳境」,模型融合、剪枝样样精通
本文第一作者庄湛,香港城市大学和南方科技大学联合培养博士生,研究方向是迁移学习、扩散模型、大模型微调等。 本文通讯作者魏颖,浙江大学「百人计划」研究员,博士生导师,研究方向包括持续学习、迁移学习、组合泛化以及在科学领域中的应用等。 通讯作者张宇,南方科技大学副教授,研究方向包括深度学习、多任务学习、迁移学习、元学习以及在计算机视觉和自然语言处理方面的应用。
7/26/2025 11:02:00 PM
机器之心
ICML 2025 | 大模型能在信息不完备的情况下问出正确的问题吗?
大语言模型(Large Language Model, LLM)在复杂推理任务中表现卓越。 借助链式思维(Chain-of-Thought, CoT),LLM 能够将复杂问题分解为简单步骤,充分探索解题思路并得出正确答案。 LLM 已在多个基准上展现出优异的推理能力,尤其是数学推理和代码生成。
7/24/2025 1:15:00 PM
机器之心
ICML 2025 | 质量更高、噪声更低、生物信号更强,东京大学&麦吉尔大学提出空间转录组数据建模新方法SUICA
作者 | 论文团队编辑 | ScienceAI空间转录组(Spatial Transcriptomics, ST)数据是在同一张组织切片上同步记录「基因表达量」和「空间坐标」的高维信息矩阵。 近期,东京大学郑银强老师组、麦吉尔大学丁俊老师组共同提出了一种针对空间转录组数据建模的方法 SUICA。 相关成果以《Suica: Learning super-high dimensional sparse implicit neural representations for spatial transcriptomics》为题,入选 ICML 2025。
7/21/2025 11:51:00 AM
ScienceAI
ICML 2025|多模态理解与生成最新进展:港科联合SnapResearch发布ThinkDiff,为扩散模型装上大脑
本文第一作者密振兴,香港科技大学计算机科学与技术学院人工智能方向博士生,研究方向是多模态理解与生成,3D/4D 重建与生成,目前正在寻找工业界全职职位或实习职位。 自 Stable Diffusion、Flux 等扩散模型 (Diffusion models) 席卷图像生成领域以来,文本到图像的生成技术取得了长足进步。 但它们往往只能根据精确的文字或图片提示作图,缺乏真正读懂图像与文本、在多模 态上下文中推理并创作的能力。
7/16/2025 12:50:00 PM
机器之心
ICML 2025杰出论文出炉:8篇获奖,南大研究者榜上有名
包括 6 篇杰出论文奖和 2 篇杰出立场论文奖。 本周一,ICML 2025 公布了最佳论文奖项。 今年获奖论文共计 8 篇,其中包括 6 篇杰出论文奖和 2 篇杰出立场论文奖。
7/15/2025 2:54:00 PM
机器之心
ICML 2025 | M+框架来了,增加LLM隐空间记忆,不再受上下文窗口限制
本文的第一作者Yu Wang来自加州大学圣地亚哥分校,主要研究方向为Memory for LLMs and Memory for LLM Agents. 该论文于2024年在MIT-IBM Waston Lab实习过程中完成,通讯作者Zexue He也毕业于加州大学圣地亚哥分校。 M 是在 MemoryLLM 之上提出的长期隐空间记忆扩展框架:通过把「过期」隐藏向量写入 CPU - 侧长期记忆池,再用协同检索器拉回最相关记忆,它将 8 B 级模型的有效记忆跨度从原本不到 20 k tokens 提升到 160 k tokens 以上,同时显存占用保持不变。
7/15/2025 11:42:00 AM
机器之心
ICML 2025,相约加拿大温哥华!机器之心免费请你吃饭
作为 AI 领域最具影响力的学术会议之一,今年 ICML 将于 7 月 13 日至 7 月 19 日在加拿大温哥华会议中心举行。 在高强度的会议日程之外,不妨为自己预留一些时间,参与一场更轻松、更自由的线下交流活动 ——7 月 15 日「云帆・ICML 2025 AI Talent Meetup」期待您的到来。 这是机器之心与上海人工智能实验室、东方菁汇、全球高校人工智能学术联盟共同攒的饭局,旨在为企业和人才搭建沟通桥梁。
7/11/2025 8:30:00 PM
机器之心
ICML 2025 | 清华、上海AI Lab提出专家级医学基准MedXpertQA,看o3、R1哪家强
本文作者来自于清华大学和上海 AI Lab,通讯作者为清华大学丁宁助理教授和清华大学讲席教授、上海 AI Lab 主任周伯文教授。 论文标题:MedXpertQA: Benchmarking Expert-Level Medical Reasoning and Understanding论文:: : ICML 2025 接收,并且被 DeepMind MedGemma 采用为评估基准。 基准地址:?
7/8/2025 1:01:00 PM
机器之心
ICML 2025 | 多智能体的ChatGPT时刻?上交MAS-GPT实现工作流一键生成
本文第一作者叶锐,上海交通大学博士三年级,研究方向是大模型多智能体,联邦学习,博士导师陈思衡,上海交通大学人工智能学院副教授。 OpenAI 将 “组织级智能 (Organizational AI)” 设定为通向 AGI 的第五个重要阶段 —— 期待 AI 能像一个高效协作的组织那样,处理复杂任务并协调大规模运作。 多智能体系统(Multi-Agent Systems, MAS)正是实现这一目标的重要探索方向。
7/5/2025 6:29:00 PM
机器之心
- 1
资讯热榜
OpenAI 开源模型被 Meta 研究员“逆改”!只动0.3%参数,gpt-oss-20B 解锁无约束基座
首个面向肽分子设计的大模型平台:直接「读序列」出结合子,无需结构输入即可生成
奥特曼:我承认GPT-5发布搞砸了
网易有道发布子曰教育大模型多款AI新品,定义教育AI应用能力L1-L5分级
小红书发布DynamicFace人脸生成技术,实现高质量图像视频人脸融合
GPT 4o-mini华人领队离开OpenAI:真正推动AI进步不是模型架构,而是互联网
摩根士丹利:AI 革命将为标准普尔 500 指数企业每年节省近 1 万亿美元
OpenAI加速推进GPT-6开发,奥尔特曼承诺打造"有记忆"的个性化AI助手
标签云
AI
人工智能
OpenAI
AIGC
模型
ChatGPT
DeepSeek
AI绘画
谷歌
机器人
数据
大模型
Midjourney
开源
智能
用户
Meta
微软
GPT
学习
技术
图像
Gemini
马斯克
AI创作
智能体
论文
Anthropic
英伟达
代码
训练
算法
Stable Diffusion
芯片
AI新词
LLM
蛋白质
腾讯
开发者
生成式
Claude
苹果
Agent
AI for Science
神经网络
3D
机器学习
研究
生成
xAI
人形机器人
AI视频
计算
Sora
百度
GPU
AI设计
华为
工具
大语言模型
搜索
具身智能
RAG
字节跳动
大型语言模型
场景
深度学习
预测
伟达
视觉
Transformer
视频生成
AGI
架构
神器推荐
亚马逊
Copilot
DeepMind
特斯拉
应用