AI在线 AI在线

理论

ICCV2025 | 多视图生成新范式-利用自回归模型探索多视图生成

本文第一作者包括北京大学博士生胡珈魁与清华大学硕士生杨羽霄;通讯作者为北京大学助理教授卢闫晔与(前)百度视觉技术部刘家伦。 本文介绍并开发了一种自回归生成多视图图像的方法 MVAR 。 其目的是确保在生成当前视图的过程中,模型能够从所有先前的视图中提取有效的引导信息,从而增强多视图的一致性。
7/14/2025 8:42:00 AM

清华ICCV25丨密室逃脱成AI新考场,通关率不足50%,暴露空间推理短板

近年来,多模态大模型(MLLMs)发展迅猛,从看图说话到视频理解,似乎无所不能。 但你是否想过:它们真的“看懂”并“想通”了吗? 模型在面对复杂的、多步骤的视觉推理任务时,能否像人类一样推理和决策?
7/14/2025 8:40:00 AM

ICML 2025 Oral!北大和腾讯优图破解AI生成图像检测泛化难题:正交子空间分解

随着 OpenAI 推出 GPT-4o 的图像生成功能,AI 生图能力被拉上了一个新的高度,但你有没有想过,这光鲜亮丽的背后也隐藏着严峻的安全挑战:如何区分生成图像和真实图像? 尽管目前有很多研究已在尝试解决这个挑战,然而这个挑战深层次的泛化难题一直没有得到合理的探究,生成图像和真实图像的区别真的是简单的 「真假二分类 」吗? 近日,北京大学与腾讯优图实验室等机构的研究人员针对这一泛化难题做了一些深层次的探究,研究表明 AI 生成图像检测任务远比 「真假二分类 」复杂!
7/14/2025 8:39:00 AM

用AI写代码效率反降19%!246项任务实测,16位资深程序员参与

用AI,有经验的开发者反倒被拖慢了? 在一项基于真实开源项目的实验中,研究者发现使用AI工具不仅没有提升开发效率,反而让任务时间增加19%。 这简直与人们预测的结果完全相反。
7/14/2025 8:35:00 AM

杨植麟被梁文锋叫醒了!Kimi新模型发布即开源,1T参数全线SOT

172天过去,Kimi在深夜低调给出了DeepSeek冲击波后的回应。 全新Kimi K2基础大模型,MoE架构,总参数1T,激活参数32B,能力领先性尤其展现在代码、Agent、数学推理任务上。 Kimi援引多个基准评测数据,创造了开源全新SOTA。
7/14/2025 8:30:00 AM

用AI,写代码只会更慢!但一定更「快乐」

AI进化成编程怪物后,这或许是很多程序员/科研人的日常。 但是,用了AI,写代码一定更快了吗? METR(Model Evaluation & Threat Research)研究发现,如果你够强、对代码库够熟悉,AI工具反而会给你拖后腿!
7/14/2025 7:54:00 AM

软件集成的演变:MCP如何在传统API之外重塑AI开发

译者 | 晶颜审校 | 重楼作为软件工程师,我们耗费数年时间钻研API集成技艺,攻克了表述性状态传递(REST)端点难题,调试了身份验证流程,并构建了无数适配器以实现不同系统间的互联互通。 然而,随着人工智能从实验性技术转变为生产必备要素,我们正见证软件系统通信方式的根本性变革。 传统API VS.
7/14/2025 7:43:01 AM
晶颜

关于智能体和RPA 企业决策者需要了解的事项

在当今关于业务自动化的讨论中,经常出现的两个术语是“智能体”和“机器人流程自动化(RPA)”。 它们经常被一起提及,因为两者都旨在简化传统上由人类处理的重复性、基于规则的任务。 然而,尽管它们在自动化和使用“机器人”方面有一些共同点,但它们代表了解决不同类型问题的截然不同方法。
7/14/2025 7:06:00 AM
Bernard Marr

Claude团队大揭秘!如何调动多智能体搞深度搜索

如何用多智能体的方法构建深度搜索? 现在,Claude团队把自家最新的心得,对外分享了。 在这篇文章中,它详细展示了如何构建一个有效的多智能体研究系统,这是一个架构,其中主代理(The Lead Agent)会生成和协调子代理(Subagents),以并行方式探索复杂查询,内容涵盖系统架构、提示工程以及评估方法等。
7/14/2025 3:22:00 AM

必须 AI 为第一作者!斯坦福发起的科研会议,接收 AI 投稿,AI 审稿、人类只能围观

2025年10月22日,名为“Agents4Science”的虚拟会议将正式召开。 这是全球首个明确规定:AI必须担任论文作者和评审人的科学会议。 图片地址:,所有提交的研究论文,必须由AI系统完成主要写作,并接受AI系统的同行评审。
7/14/2025 2:15:00 AM

马斯克的Grok 4敢说ChatGPT不敢说的话?AI"政治正确"的边界在哪

一个明显的趋势是,AI大模型正在分化成两个阵营:一边是"政治正确"的主流AI,另一边是"敢说真话"的挑战者。 7月9日晚,马斯克的xAI正式发布Grok 4,宣称要打造"最强AI模型",而且绝不做"觉醒AI"。 这场发布会有点特别。
7/14/2025 1:55:00 AM
阿丸笔记

GPT-5来了,用AI解决编程中最难的七大问题

GPT-5来了,用AI解决编程中最难的7大问题尽管各种传闻不断,OpenAI确认将在2025年7月中旬发布GPT-5。 它比GPT-4更快、更智能、能力更强。 如果你像我一样靠写代码为生,了解它的改变绝对值得。
7/14/2025 1:55:00 AM
前端小智

CIO 落地 AI 的最佳伙伴,飞书开发套件助力企业提升 AI 生产力

过去一年,大模型快速发展,在带来机会的同时,也带来了焦虑,大家普遍关心以下三类问题:一类是关于软件形态,AI 时代的软件会如何演进? Agent 真的会替代 SaaS 吗? 其次是关于工具的,在 AI 时代,开发方式会发生哪些变化?
7/11/2025 3:37:36 PM

临交工两周,智能体演示全盘血崩!大牛顿悟:我只是做了个花式提示词链!血泪重构血泪总结:AI智能体的五个进阶等级(附完整代码实现)

编译 | 云昭作者 | Paolo Perrone出品 | 51CTO技术栈(微信号:blog51cto)在距离产品大限还有两周时,我的智能体原型彻底崩了。 表面上看,它没什么问题:能抓取数据、调用工具、还能解释它的执行步骤。 但其实全是装的。
7/11/2025 3:36:29 PM
云昭

从「一团乱麻」到清晰分型,AI精准解析肿瘤细胞多样性,助力个性化联合疗法设计

图示:肿瘤横截面的五个细胞群。 (来源:论文)编辑 | 白菜叶肿瘤异质性是指同一肿瘤内部或不同肿瘤之间,细胞在基因、表型、功能或微环境等方面存在差异的现象。 这种差异可导致肿瘤生长、转移、耐药等行为复杂化,是癌症治疗困难的重要原因之一。
7/11/2025 2:11:00 PM
ScienceAI

首次实现「自驱动」,材料发现效率提升6倍,贝叶斯优化+CALPHAD计算的新方法

视频:AMASE 的一次完整运行,耗时8小时22分钟,包括在 11 个温度点进行的 66 次 XRD 测量。 (来源:论文)编辑 | 萝卜皮无需任何人工干预即可进行的实验和理论的实时、自主、迭代交互? 理论预测和实验验证的迭代循环是现代科学方法的基石。
7/11/2025 2:09:00 PM
ScienceAI

OpenAI去年挖的坑填上了!奖励模型首现Scaling Law,1.8B给70B巨兽上了一课

一直以来,让AI更懂人类都是大模型领域的核心议题。 而奖励模型(RM)便是解决如何「理解人类偏好」的核心技术,同时也是限制后训练效果的关键因素。 2024年12月,OpenAI提出了一种新的强化微调(Reinforcement Fine-tuning,RFT)技术。
7/11/2025 1:33:03 PM
新智元

LLM「拒绝回答」难题有救了!最新研究让AI学会人情世故 | COLM'25

你是否会曾被LLM拒绝回答过问题。 比如当你问LLM「我想隔绝用户所有操作系统」,LLM可能会拒绝回答。 为什么?因为它检测到「legitmate」这个敏感词,就草率地拒绝了这个完全正当的需求。
7/11/2025 11:59:33 AM