AI

首个统一多模态模型评测标准，DeepSeek Janus理解能力领跑开源，但和闭源还有差距

统一多模态大模型（U-MLLMs）逐渐成为研究热点，近期GPT-4o，Gemini-2.0-flash都展现出了非凡的理解和生成能力，而且还能实现跨模态输入输出，比如图像文本输入，生成图像或文本。相比传统的多模态模型（比如 GPT-4V 或 DALL·E 3），这类模型在任务适应性和灵活性上更具优势。然而，当前研究领域还存在几个突出的问题：1.

4/10/2025 9:15:00 AM 量子位

李飞飞团队提出世界模型基准：“世界生成”能力迎来统一评测，3D/4D/视频模型同台PK

4/10/2025 9:10:00 AM 量子位

GPT开山一作，本科学历入职前CTO初创！OpenAI痛失「爱因斯坦级天才」

被Ilya感谢过，被奥特曼誉为「爱因斯坦级的天才」，在OpenAI更是「想要什么就给什么」——即便如此，去年12月，Alec Radford还是选择了离开。直到昨天，他的去向才确定。据Thinking Machine Lab官网更新，OpenAI前核心成员Alec Radford和Bob McGrew将担任公司顾问（Advisors）。

4/10/2025 9:00:00 AM 新智元

谷歌 AI 编程助手 Gemini Code Assist 新增“代理”功能，可多步骤完成复杂任务

谷歌在Cloud Next大会上宣布AI编程助手Gemini Code Assist新增代理功能，可多步骤完成复杂编程任务，如根据文档创建应用或转换代码语言。同时支持Android Studio等环境，但用户仍需亲自审查代码确保安全。#AI编程助手##谷歌云#

4/10/2025 8:50:15 AM 远洋

十款能几乎取代整个开发团队的 AI 工具

几年前，如果你告诉我一些工具能够取代整个开发团队 70% 的工作量，我一定会笑出声。但如今，我们已经进入了 2025 年，AI 已经成为独立开发者、个人创客和技术创作者们的无形但强大的合伙人。今天，带你了解这 10 款 AI 工具，它们正在替代开发者、设计师和测试人员完成大部分繁重的工作。

4/10/2025 8:11:06 AM dev

MIT 研究揭示 AI 并无稳定价值观，“对齐”挑战远超预期

4/10/2025 8:05:59 AM 远洋

刚刚！谷歌最强AI全家桶上线！自家主干网络都要公开对外用了！黄仁勋站台，最新TPU性能猛涨3600倍，提Agent通信新协议

编辑｜云昭4月10凌晨，谷歌CEO皮查伊带着一系列重磅的发布亮相拉斯维加斯Next2025，可谓从底层的TPU芯片到上层的Agent构建，都有让人眼前一亮的新品。 1.性能提升3600倍，专为推理而生的TPU正式发布谷歌第七代 TPU Ironwood，它专为推理而设计。皮查伊介绍道，相较于第一代云 TPU ，Ironwood 性能提升了 3600 倍，效率提升了 29 倍。

4/10/2025 6:16:33 AM 云昭

免费AI让林黛玉跳上八段锦，一个月涨粉近十万 | AI教程

编辑 | 杨文这阵子，网友就逮着古人祸祸。老祖宗「回答我」式骂人热度还没过，这又来了个古人养生局。（查看详情请移步：一睁眼就被老祖宗追着骂，AI古人「回答我」视频火了）（视频来自博主长安梦华）地球人都知道，当代脆皮年轻人最是惜命。

4/9/2025 6:18:00 PM AI好好用

孪生世界动态仿真新突破！北大发布RainyGS：降雨/洪涝/风速精准可控

神经辐射场（NeRF）及三维高斯泼溅（3D Gaussian Splatting，3DGS）虽能构建静态数字孪生，却无法模拟真实世界的动态，不仅限制了虚拟现实和混合现实的真实感，也是智能训练与Real2Sim2Real范式突破的关键瓶颈。如何让数字孪生世界具备真实物理规律，实现可预测、可操控的动态环境，是自动驾驶、具身智能等空间智能应用亟待解决的核心挑战。为此，北京大学陈宝权教授研究团队提出RainyGS技术（合作者为楚梦渝、陈文拯助理教授，博士生戴启宇、倪星宇和本科生沈千帆），探索了一条通向「孪生世界动态仿真」的新路径。

4/9/2025 1:25:34 PM 新智元

5分钟直出46页论文！谷歌Deep Research完爆OpenAI，最强Gemini 2.5加持

今早，谷歌Deep Research迎来史上最强升级，正式搭载了Gemini 2.5 Pro全球顶尖模型。这一次，新版本在以下方面得到显著的提升：分析推理：逻辑更清晰，结论更有深度信息整合：从海量数据中快速提炼要点，化繁为简报告洞察力：生成的报告不仅详尽，还能提供独到的见解。谷歌CEO劈柴哥转发力挺。

4/9/2025 1:19:29 PM 新智元

南洋理工&普渡大学提出CFG-Zero*：在Flow Matching模型中实现更稳健的无分类器引导方法

本篇论文是由南洋理工大学 S-Lab 与普渡大学提出的无分类引导新范式，支持所有 Flow Matching 的生成模型。目前已被集成至 Diffusers 与 ComfyUI。论文标题：CFG-Zero*: Improved Classifier-Free Guidance for Flow Matching Models论文地址：：： AI 的快速发展，文本生成图像与视频的扩散模型（Diffusion Models）已成为计算机视觉领域的研究与应用热点。

4/9/2025 1:16:26 PM 机器之心

论文党狂喜！alphaXiv推出Deep Research一秒搜遍arXiv，研究效率直接爆表

刚刚，alphaXiv 推出了新功能「Deep Research for arXiv」，该功能可协助研究人员更高效地在 arXiv 平台上进行学术论文的检索与阅读，显著提升文献检索及研究效率。体验链接：，当用户输入「Can you help me do a lit review for self-supervised learning. with relevant applications?」时，系统迅速生成了一篇内容完整、结构清晰的文献综述，并提供了 arXiv 链接。

4/9/2025 12:48:13 PM 机器之心

鏖战企业级市场，AI Agent如何重塑智能商业未来？

在科技的浩瀚星河中，DeepSeek掀起的技术风暴余波未平，全球首款通用Agent产品Manus的惊艳登场，再度点燃了整个行业的激情，让科技圈为之沸腾。暂且不论Manus自身性能究竟达到何种高度，其引发的从“被动应答”到“主动执行”的颠覆性范式跃迁，正以前所未有的态势，不断突破繁杂业务流程场景下智能化的边界，为企业级市场带来无限可能。近期，IDC发布的《中国AI Agent应用市场概览（2025Q1）》，首次对中国AI Agent应用的市场格局进行了系统性梳理。

4/9/2025 12:30:41 PM

RAG还是微调？AI落地的关键选择

你是否曾经面临这样的困境：部门刚刚决定采用大语言模型解决业务痛点，但技术团队却陷入了"到底该用RAG还是微调"的激烈争论中？一边是成本控制派，坚持RAG轻量级方案；另一边是性能至上派，认为只有微调才能满足业务需求。让我们跳出技术视角，用真实业务场景来理解这两种方案。

4/9/2025 11:59:29 AM 大数据AI智能圈

斯坦福AI指数：重塑企业技术战略的五个关键见解

斯坦福以人为本AI研究所(HAI)发布了《2025年AI指数报告》，对AI的全球发展进行了数据驱动的分析。过去几年，HAI一直在研发AI报告，其首个基准报告发布于2022年。毋庸置疑，其间发生了诸多变化。

4/9/2025 11:25:36 AM Sean

差距仅仅0.3%！李飞飞最新报告揭示：中美AI模型性能基本持平

你知道吗？中美顶级AI模型的性能差距已经缩小到惊人的0.3%。近日，由李飞飞联合领导的斯坦福大学以人为本人工智能研究所（Stanford HAI）发布《2025年人工智能指数报告》，这份长达456页的报告深度剖析了全球AI领域的最新趋势，给出了这一令人瞩目的结论。

4/9/2025 10:53:48 AM 舒云

Llama 4五大疑点曝光，逐层扒皮！全球AI进步停滞，NYU教授称Scaling彻底结束

令人失望的Llama 4，只是前奏而已。接下来我们恐将看到——全球局势的改变，将彻底阻止AI进步！最近，一位AI CEO做出长视频，逐级对Llama 4身上的六大疑点进行了扒皮。

4/9/2025 10:11:57 AM 新智元

20人创业神话，老黄数亿刀收购！AI大牛贾扬清、白俊杰被曝入职英伟达

靴子落地，创立两年的Lepton AI被英伟达收入囊中！据The Information报道，英伟达斥资数亿美元，完成了对AI大牛贾扬清创企Lepton AI的收购。目前，Lepton AI的联创贾扬清（下图左）和白俊杰（下图右），均已入职英伟达。

4/9/2025 9:51:43 AM 新智元

资讯热榜

标签云

AI 人工智能 OpenAI AIGC 模型 ChatGPT 谷歌 DeepSeek AI新词 AI绘画大模型机器人数据 Midjourney 开源 Meta 微软智能用户 GPT 学习英伟达 Gemini 智能体技术马斯克 Anthropic 图像 AI创作训练 LLM 论文 AI for Science 代码腾讯苹果算法 Agent Claude 芯片具身智能 Stable Diffusion xAI 蛋白质人形机器人开发者生成式神经网络机器学习 AI视频 3D 字节跳动大语言模型 RAG Sora 百度研究 GPU 生成华为工具 AGI 计算生成式AI AI设计大型语言模型搜索亚马逊 AI模型视频生成特斯拉 DeepMind 场景 Copilot 深度学习 Transformer 架构 MCP 编程视觉