模型

7B模型对标GPT-4o，全球首个医疗代码生成大模型训练平台来了

医疗AI场景复杂，需要“又懂医疗又懂编程”的agent。但像GPT这样现成的大模型难以直接部署，该如何突破技术壁垒？答案是：打造一个统一的训练平台，专门训练能够生成医疗代码的大模型。

7/14/2025 9:00:00 AM

攻克「恶意投毒」攻击！华南理工联合霍普金斯和UCSD，连登TPAMI、TIFS顶刊

虽然无法彻底解决维度诅咒带来的问题，根据理论证明，曼哈顿距离在高维空间中的识别能力要远远好于常用的欧式距离，可以缓解维度诅咒效应。方法框架即便曼哈顿距离有着更好的识别效力，但是研究人员也不认为在识别后门攻击的时候曼哈顿就能完全替代欧氏距离。除此以外，先前的工作已经表明[3]，有的后门攻击会在欧氏距离上表现区分度，有的则会在余弦相似度（Cos 距离）上表现差异。

7/14/2025 8:57:00 AM

EasyCache：无需训练的视频扩散模型推理加速——极简高效的视频生成提速方案

论文作者团队简介：本文第一作者周鑫，共同第一作者梁定康，均为华中科技大学博士生，导师为白翔教授。合作者包括华中科技大学陈楷锦、冯天瑞、林鸿凯，旷视科技陈习武、丁宜康、谭飞杨和香港大学赵恒爽助理教授。在HunyuanVideo上，EasyCache在复杂场景下保持与原视频的一致外观，同时显著加速1.

7/14/2025 8:51:00 AM

模拟大脑功能分化！北大与港中文发布Fast-in-Slow VLA，让“快行动”和“慢推理”统一协作

作者简介：由来自北京大学、香港中文大学、北京智源研究院、智平方的老师同学联合研究，作者包括博士生陈浩、刘家铭、顾晨阳、刘卓洋，通讯作者为北京大学仉尚航。北京大学 HMI 实验室长期致力于具身智能和多模态学习领域的研究，欢迎关注。快执行与慢思考：在机器人操控领域，实现高频响应与复杂推理的统一，一直是一个重大技术挑战。

7/14/2025 8:47:00 AM

氛围编程后，Karpathy又双叒有新「脑洞」！PDF将死，未来99%是AI氛围阅读

Karpathy大神这次继Vibe Coding氛围编程后，又想造全新概念了！大神说他早就抱怨了很多次，未来99%的「Attention」（注意力）即将被AI，而非人类关注。但是现在99.9%的互联网内容还是「写给人看的」，不论是网页、视频还是科研PDF论文。

7/14/2025 8:44:00 AM

ICCV2025 | 多视图生成新范式-利用自回归模型探索多视图生成

本文第一作者包括北京大学博士生胡珈魁与清华大学硕士生杨羽霄；通讯作者为北京大学助理教授卢闫晔与（前）百度视觉技术部刘家伦。本文介绍并开发了一种自回归生成多视图图像的方法 MVAR 。其目的是确保在生成当前视图的过程中，模型能够从所有先前的视图中提取有效的引导信息，从而增强多视图的一致性。

7/14/2025 8:42:00 AM

清华ICCV25丨密室逃脱成AI新考场，通关率不足50%，暴露空间推理短板

近年来，多模态大模型（MLLMs）发展迅猛，从看图说话到视频理解，似乎无所不能。但你是否想过：它们真的“看懂”并“想通”了吗？模型在面对复杂的、多步骤的视觉推理任务时，能否像人类一样推理和决策？

7/14/2025 8:40:00 AM

ICML 2025 Oral！北大和腾讯优图破解AI生成图像检测泛化难题：正交子空间分解

随着 OpenAI 推出 GPT-4o 的图像生成功能，AI 生图能力被拉上了一个新的高度，但你有没有想过，这光鲜亮丽的背后也隐藏着严峻的安全挑战：如何区分生成图像和真实图像？尽管目前有很多研究已在尝试解决这个挑战，然而这个挑战深层次的泛化难题一直没有得到合理的探究，生成图像和真实图像的区别真的是简单的「真假二分类」吗？近日，北京大学与腾讯优图实验室等机构的研究人员针对这一泛化难题做了一些深层次的探究，研究表明 AI 生成图像检测任务远比「真假二分类」复杂！

7/14/2025 8:39:00 AM

用AI写代码效率反降19%！246项任务实测，16位资深程序员参与

用AI，有经验的开发者反倒被拖慢了？在一项基于真实开源项目的实验中，研究者发现使用AI工具不仅没有提升开发效率，反而让任务时间增加19%。这简直与人们预测的结果完全相反。

7/14/2025 8:35:00 AM

杨植麟被梁文锋叫醒了！Kimi新模型发布即开源，1T参数全线SOT

172天过去，Kimi在深夜低调给出了DeepSeek冲击波后的回应。全新Kimi K2基础大模型，MoE架构，总参数1T，激活参数32B，能力领先性尤其展现在代码、Agent、数学推理任务上。 Kimi援引多个基准评测数据，创造了开源全新SOTA。

7/14/2025 8:30:00 AM

用AI，写代码只会更慢！但一定更「快乐」

AI进化成编程怪物后，这或许是很多程序员/科研人的日常。但是，用了AI，写代码一定更快了吗？ METR（Model Evaluation & Threat Research）研究发现，如果你够强、对代码库够熟悉，AI工具反而会给你拖后腿！

7/14/2025 7:54:00 AM

OpenAI去年挖的坑填上了！奖励模型首现Scaling Law，1.8B给70B巨兽上了一课

一直以来，让AI更懂人类都是大模型领域的核心议题。而奖励模型（RM）便是解决如何「理解人类偏好」的核心技术，同时也是限制后训练效果的关键因素。 2024年12月，OpenAI提出了一种新的强化微调（Reinforcement Fine-tuning，RFT）技术。

7/11/2025 1:33:03 PM 新智元

LLM「拒绝回答」难题有救了！最新研究让AI学会人情世故 | COLM'25

你是否会曾被LLM拒绝回答过问题。比如当你问LLM「我想隔绝用户所有操作系统」，LLM可能会拒绝回答。为什么?因为它检测到「legitmate」这个敏感词,就草率地拒绝了这个完全正当的需求。

7/11/2025 11:59:33 AM

AB实验新突破：携程提出图贪心分流算法，解决两大核心难题

作者简介小白，携程算法工程师，关注营销定价领域。携程火车票部门为解决智行酒店商户侧AB实验中，预实验分流中遇到的分流不均、分流组流量交叉问题，提出了一种用于非用户端AB实验的分流算法，该算法通过优化的随机抽样模块与贪心交换模块，保证实验组之间多指标的相似性；通过图算法模块，降低实验组之间的流量交叉。通过实证分析，该算法一方面有效的提升了商户端实验在多指标下的分流效率；另一方面，相比于使用先验知识进行分流，显著降低了实验组之间的流量交叉。

7/11/2025 9:16:00 AM

告别数据「噪音」，UCSD大模型推理新方法DreamPRM充当「信号放大器」，登顶MathVista测评榜

DreamPRM 由加州大学圣地亚哥分校的研究团队开发，在数学推理权威测评榜MathVista上获得了第一名。第一作者为博士生 Qi Cao，通讯作者为该校副教授 Pengtao Xie，团队其他成员还包括王睿一，Ruiyi Zhang 和 Sai Ashish Somayajula。使用过程奖励模型（PRM）强化大语言模型的推理能力已在纯文本任务中取得显著成果，但将过程奖励模型扩展至多模态大语言模型（MLLMs）时，面临两大难题：由于多模态输入（图像文本）构成高维连续与离散信号的混合空间，训练数据与测试数据的分布偏移（Distribution Shift）远超纯文本场景，导致一般过程奖励模型泛化能力显著下降。

7/11/2025 9:15:00 AM

Manus跑路了吗？

Manus，真的从国内撤了？！ 4个月前一夜蹿红起飞的AI Agent产品Manus，刚被曝出背后公司一举裁掉国内七成团队。

7/11/2025 9:13:00 AM

推理与操控能力双提升！具身机器人双系统VLA模型新突破

让机器人学会聪明且快速精准执行，一直是机器人操控领域的难题。为了解决这个问题，香港中文大学、北京大学、智平方和北京智源研究院联合创新性地提出了Fast-in-Slow（FiS-VLA），即一个统一的双系统VLA模型。它通过将慢系统2最后几层的Transformer模块重新构建为一个高效的执行模块，用作快系统1，从而在一个模型中实现了快慢系统融合。

7/10/2025 2:55:12 PM

扩散语言模型写代码！速度比自回归快10倍

谁说扩散模型只能生成图像和视频？现在它们能高质量地写代码了，速度还比传统大模型更快！ Inception Labs推出基于扩散技术的全新商业级大语言模型——Mercury。

7/10/2025 2:54:13 PM

资讯热榜

标签云

AI 人工智能 OpenAI AIGC 模型 ChatGPT 谷歌 DeepSeek AI新词 AI绘画大模型机器人数据 Midjourney 开源 Meta 微软智能用户 GPT 学习英伟达 Gemini 智能体技术马斯克 Anthropic 图像 AI创作训练 LLM 论文 AI for Science 代码腾讯苹果算法 Agent Claude 芯片具身智能 Stable Diffusion xAI 蛋白质人形机器人开发者生成式神经网络机器学习 AI视频 3D 字节跳动大语言模型 RAG Sora 百度研究 GPU 生成华为工具 AGI 计算生成式AI AI设计大型语言模型搜索亚马逊 AI模型视频生成特斯拉 DeepMind 场景 Copilot 深度学习 Transformer 架构 MCP 编程视觉