理论

孪生世界动态仿真新突破！北大发布RainyGS：降雨/洪涝/风速精准可控

神经辐射场（NeRF）及三维高斯泼溅（3D Gaussian Splatting，3DGS）虽能构建静态数字孪生，却无法模拟真实世界的动态，不仅限制了虚拟现实和混合现实的真实感，也是智能训练与Real2Sim2Real范式突破的关键瓶颈。如何让数字孪生世界具备真实物理规律，实现可预测、可操控的动态环境，是自动驾驶、具身智能等空间智能应用亟待解决的核心挑战。为此，北京大学陈宝权教授研究团队提出RainyGS技术（合作者为楚梦渝、陈文拯助理教授，博士生戴启宇、倪星宇和本科生沈千帆），探索了一条通向「孪生世界动态仿真」的新路径。

4/9/2025 1:25:34 PM 新智元

5分钟直出46页论文！谷歌Deep Research完爆OpenAI，最强Gemini 2.5加持

今早，谷歌Deep Research迎来史上最强升级，正式搭载了Gemini 2.5 Pro全球顶尖模型。这一次，新版本在以下方面得到显著的提升：分析推理：逻辑更清晰，结论更有深度信息整合：从海量数据中快速提炼要点，化繁为简报告洞察力：生成的报告不仅详尽，还能提供独到的见解。谷歌CEO劈柴哥转发力挺。

4/9/2025 1:19:29 PM 新智元

南洋理工&普渡大学提出CFG-Zero*：在Flow Matching模型中实现更稳健的无分类器引导方法

本篇论文是由南洋理工大学 S-Lab 与普渡大学提出的无分类引导新范式，支持所有 Flow Matching 的生成模型。目前已被集成至 Diffusers 与 ComfyUI。论文标题：CFG-Zero*: Improved Classifier-Free Guidance for Flow Matching Models论文地址：：： AI 的快速发展，文本生成图像与视频的扩散模型（Diffusion Models）已成为计算机视觉领域的研究与应用热点。

4/9/2025 1:16:26 PM 机器之心

CVPR 2025 HighLight｜打通视频到3D的最后一公里，清华团队推出一键式视频扩散模型VideoScene

论文有两位共同一作。汪晗阳，清华大学计算机系本科四年级，研究方向为三维视觉、生成模型，已在CVPR、ECCV、NeurIPS等会议发表论文。刘芳甫，清华大学电子工程系直博二年级，研究方向为生成模型 (3D AIGC和Video Generation等)，已在CVPR、ECCV、NeurIPS、ICLR、KDD等计算机视觉与人工智能顶会发表过多篇论文。

4/9/2025 1:11:27 PM 机器之心

论文党狂喜！alphaXiv推出Deep Research一秒搜遍arXiv，研究效率直接爆表

刚刚，alphaXiv 推出了新功能「Deep Research for arXiv」，该功能可协助研究人员更高效地在 arXiv 平台上进行学术论文的检索与阅读，显著提升文献检索及研究效率。体验链接：，当用户输入「Can you help me do a lit review for self-supervised learning. with relevant applications?」时，系统迅速生成了一篇内容完整、结构清晰的文献综述，并提供了 arXiv 链接。

4/9/2025 12:48:13 PM 机器之心

CDO 的价值要求：通过 Agentic AI 推动业务影响

首席数据官 (CDO) 的角色发生了巨大变化。曾经的后台职能已被推到业务战略的最前沿。 CDO 现在发现自己处于第一线，肩负着将人工智能和分析转化为切实的业务优势的任务，压力很大。

4/9/2025 12:39:46 PM 晓晓

鏖战企业级市场，AI Agent如何重塑智能商业未来？

在科技的浩瀚星河中，DeepSeek掀起的技术风暴余波未平，全球首款通用Agent产品Manus的惊艳登场，再度点燃了整个行业的激情，让科技圈为之沸腾。暂且不论Manus自身性能究竟达到何种高度，其引发的从“被动应答”到“主动执行”的颠覆性范式跃迁，正以前所未有的态势，不断突破繁杂业务流程场景下智能化的边界，为企业级市场带来无限可能。近期，IDC发布的《中国AI Agent应用市场概览（2025Q1）》，首次对中国AI Agent应用的市场格局进行了系统性梳理。

4/9/2025 12:30:41 PM

RAG还是微调？AI落地的关键选择

你是否曾经面临这样的困境：部门刚刚决定采用大语言模型解决业务痛点，但技术团队却陷入了"到底该用RAG还是微调"的激烈争论中？一边是成本控制派，坚持RAG轻量级方案；另一边是性能至上派，认为只有微调才能满足业务需求。让我们跳出技术视角，用真实业务场景来理解这两种方案。

4/9/2025 11:59:29 AM 大数据AI智能圈

斯坦福AI指数：重塑企业技术战略的五个关键见解

斯坦福以人为本AI研究所(HAI)发布了《2025年AI指数报告》，对AI的全球发展进行了数据驱动的分析。过去几年，HAI一直在研发AI报告，其首个基准报告发布于2022年。毋庸置疑，其间发生了诸多变化。

4/9/2025 11:25:36 AM Sean

差距仅仅0.3%！李飞飞最新报告揭示：中美AI模型性能基本持平

你知道吗？中美顶级AI模型的性能差距已经缩小到惊人的0.3%。近日，由李飞飞联合领导的斯坦福大学以人为本人工智能研究所（Stanford HAI）发布《2025年人工智能指数报告》，这份长达456页的报告深度剖析了全球AI领域的最新趋势，给出了这一令人瞩目的结论。

4/9/2025 10:53:48 AM 舒云

使用vLLM部署工具加速QWQ，推理速度比ollama更快、并发更高

与传统的HuggingFace Transformers相比，vLLM的吞吐量高达24倍，且无需改变模型架构，它采用创新的PagedAttention算法，优化了注意力键和值的管理，从而提升了推理速度，并且其能够有效地利用多核CPU和GPU资源，显著提升LLM的推理速度。相比于ollama，vllm输出的速度更快，支持的并发更高，目前也没有遇到安全问题，稳定性非常好，更适合作为服务器的接口服务来部署。但相应的，vllm会把服务器的GPU显存都占满，使得机器无法再部署其他服务，同时ollama部署更加的简单，也是因为这个原因ollama在最近部署deepseek的热潮中被提到的更多一些，因此个人使用可能ollama更合适。

4/9/2025 10:47:02 AM 贝塔街的万事

英伟达253B开源新王登场，Llama 4三天变陪衬！直逼DeepSeek-R1成推理天花板

Llama 4诞生不过3天，反手就被超越了。刚刚，英伟达官宣开源「超大杯」Llama Nemotron推理模型，共有253B参数，基于Llama-3.1-405B微调而来。在多项基准测试中，Llama Nemotron一举击败了两款Llama 4模型。

4/9/2025 10:40:32 AM 新智元

Llama 4五大疑点曝光，逐层扒皮！全球AI进步停滞，NYU教授称Scaling彻底结束

令人失望的Llama 4，只是前奏而已。接下来我们恐将看到——全球局势的改变，将彻底阻止AI进步！最近，一位AI CEO做出长视频，逐级对Llama 4身上的六大疑点进行了扒皮。

4/9/2025 10:11:57 AM 新智元

20人创业神话，老黄数亿刀收购！AI大牛贾扬清、白俊杰被曝入职英伟达

靴子落地，创立两年的Lepton AI被英伟达收入囊中！据The Information报道，英伟达斥资数亿美元，完成了对AI大牛贾扬清创企Lepton AI的收购。目前，Lepton AI的联创贾扬清（下图左）和白俊杰（下图右），均已入职英伟达。

4/9/2025 9:51:43 AM 新智元

Coze工作流×DeepSeek二创引擎！抖音/小红书/公众号链接秒变飞书表格，日省8小时

前言在短视频与图文内容井喷的今天，创作者面临信息过载、二创合规性困境及多平台适配壁垒。跨平台爆款内容分散于不同生态，人工搬运低效且素材利用率不足20%。直接搬运面临限流风险，而人工改写效率低下，难以平衡原创度与爆款基因。

4/9/2025 9:50:00 AM 后端小肥肠

UI-R1 | 仅136张截图，vivo开源DeepSeek R1式强化学习，提升GUI智能体动作预测

基于规则的强化学习（RL/RFT）已成为替代 SFT 的高效方案，仅需少量样本即可提升模型在特定任务中的表现。该方法通过预定义奖励函数规避人工标注成本，如 DeepSeek-R1 在数学求解中的成功应用，以及多模态领域在图像定位等任务上的性能突破（通常使用 IOU 作为规则 reward）。 vivo 与香港中文大学的研究团队受到 DeepSeek-R1 的启发，首次将基于规则的强化学习（RL）应用到了 GUI 智能体领域。

4/9/2025 9:41:43 AM 机器之心

AI危险检测再进化！三层级解析长视频异常，各种时序粒度均有明显优势 | CVPR HighLight

多模态视频异常理解任务，又有新突破！ “异常理解”是指在视频监控、自动驾驶等场景中，利用模型发现视频中的异常内容，从而预判危险，以便及时做出决策。来自华中科大等机构的研究人员，提出了新的视频异常理解模型Holmes-VAU，以及相关数据集。

4/9/2025 9:25:00 AM 量子位

"是我创造了第一个LLM"！Kaggle前首席科学家一句话引发AI学术圈考古行动

论如何在技术圈争论中一句话噎到对方：哥们，是我创造了第一个大语言模型。发言者Jeremy Howard为澳大利亚昆士兰大学名誉教授、曾任Kaggle创始总裁和首席科学家，现answer.ai与fast.ai创始人，。事情的起因是有人质疑他最近的项目llms.txt在帮助大模型爬取互联网信息上并没太大作用，从而引发了这段争论，迅速引起众人围观。

4/9/2025 9:23:00 AM 量子位

资讯热榜

免费！让图片放大不失真的位图转矢量图神器 Tmttool AI应用新纪元：2025中国AI应用排行榜榜单揭晓丨2025年1月 6秒视频10秒生成！全新AI视频神器 Grok Imagine 深度体验+元提示词分享最火、最全的Agent记忆综述，NUS、人大、复旦、北大等联合出品后悔没早发现！教你用谷歌Gemini生成精美PPT（附提示词） GGUF 是什么？一文看懂大模型里最火的模型格式 Sora、可灵、即梦哪家强？AI视频软件深度测评！ OmniParser V2 在 Windows 系统上的详细安装与运行指南

标签云

AI 人工智能 OpenAI AIGC 模型 ChatGPT 谷歌 DeepSeek AI新词 AI绘画大模型机器人数据 Midjourney 开源 Meta 微软智能用户 GPT 学习英伟达 Gemini 智能体技术马斯克 Anthropic 图像 AI创作训练 LLM 论文 AI for Science 代码腾讯苹果算法 Agent Claude 芯片具身智能 Stable Diffusion xAI 蛋白质人形机器人开发者生成式神经网络机器学习 AI视频 3D 字节跳动大语言模型 RAG Sora 百度研究 GPU 生成华为工具 AGI 计算生成式AI AI设计大型语言模型搜索亚马逊 AI模型视频生成特斯拉 DeepMind 场景 Copilot 深度学习 Transformer 架构 MCP 编程视觉