理论

奥特曼：ChatGPT不是AGI！OpenAI最强开源模型直击DeepSeek

近了，近了！全网多个流出的代码截图显示，满血版o3、o4-mini，以及o4-mini high，有极大概率在下周发布。不仅如此，在OpenRouter平台上，一款神秘模型Optimus Alpha（ELO得分1387）直接霸榜，据称就是o4-mini。

4/14/2025 9:17:00 AM 新智元

AI奥数大奖出炉，英伟达摘桂冠！14B破解34题暴击DeepSeek R1

第二届人工智能数学奥林匹克竞赛（AIMO2）开奖了！作为大赛顾问委员会的一员，陶哲轩激动地宣布了最新的结果——英伟达团队AI成功破解了34道题（共50题）。这一次，50道测试题保持了与AIMO1相同「数值答案」形式基础上，进一步提升了「抗暴力破解」的难度。

4/14/2025 9:15:00 AM 新智元

人类一生所学不过4GB，加州理工顶刊新研究引热议

24小时不间断学习且不遗忘，一辈子也只有4GB的“知识储量”？科学家们最新研究，计算出了人类学习积累上限，就这么多~~（甚至还不如一块U盘能装）。这是来自Cell旗下神经科学顶刊Neuron上的一项工作，它提出了一个发人深省的悖论：人类信息处理速度仅为每秒10bit，而我们的感官系统却能以每秒10亿bit的速率收集数据。

4/14/2025 9:10:00 AM 量子位

GPT-4.1偷偷开跑？神秘模型上线三天已被玩疯，网友发现大量OpenAI痕迹

上线仅三天的神秘模型，已经鲨疯了！大模型聚合平台OpenRouter新推出的Optimus Alpha，已经处理了772亿Token，平均每天超过200亿。并且这个数字还在上升，日Token处理已超过340亿，排名第二，并在Trending榜单上位列第一。

4/14/2025 9:00:00 AM 量子位

AI Agent 破局：MCP 与 A2A 定义安全新边界

作者 | Nicky，混元安全团队朱雀实验室通信协议是AI Agent加速落地的核心基础设施之一。 Anthropic推出的MCP已逐步确立其作为AI Agent连接外部工具的标准协议地位，而Google最新发布的A2A则聚焦于打破智能体协作壁垒，推动跨Agent协同体系的构建。作为AI Agent时代最受关注的两大通信规范，它们的安全性直接关乎AI Agent的安全边界，任何安全问题都可能引发AI Agent被劫持与数据泄露等连锁风险。

4/14/2025 9:00:00 AM 腾讯技术工程

Google ADK，知多少？

Hello folks，我是 Luga，今天我们来聊一下人工智能应用场景 - 构建高效、灵活的开源代码利器——Google ADK。在人工智能领域风起云涌的 2025 年，Google 再次以创新之姿震撼业界，推出了备受瞩目的 Agent Development Kit（ADK）——一个开放源代码的利器，旨在重塑多智能体系统的开发格局！从 Google 自身的 Agentspace 到 Customer Engagement Suite，这款工具不仅驱动了 Google 的内部 AI 革命，更通过开源的方式，将强大的开发能力交到了你我手中。

4/14/2025 8:50:00 AM Luga Lee

4090玩转大场景几何重建，RGB渲染和几何精度达SOTA｜上海AI Lab&西工大新研究

仅用4090就能实现大规模城市场景重建！高效几何重建新架构CityGS-X来了，通过一种新型并行化混合分层三维表征架构（PH²-3D）的可扩展系统，突破了传统三维重建在算力消耗和几何精度上的限制。算力瓶颈无处不在，当前3D高斯泼溅技术虽取得显著进展，却仍面临三大核心挑战：处理速度缓慢、计算成本高昂、几何精度有限。

4/14/2025 8:40:00 AM 量子位

手机实现GPT级智能，比MoE更极致的稀疏技术：省内存效果不减｜对话面壁&清华肖朝军

在大模型争霸的时代，算力与效率的平衡成为决定胜负的关键。端侧部署一直是大模型落地的最后一公里，却因算力瓶颈困难重重。面壁智能和清华走出了一条与MoE不同的路径——神经元级稀疏激活，让模型在保持性能的同时大幅降低资源消耗。

4/14/2025 8:30:00 AM 量子位

八个面向前端方向的 AI 编程助手，总有一款适合你！

Hello，大家好，我是 Sunday。通过 AI 辅助开发是未来的大趋势，所以今天就为大家推荐 8 个 AI 编程助手（针对前端方向），大家可以选择适合的工具，从而大幅提升工作效率！ Webcrumbs — 使用 TailwindCSS 即时生成组件图片官网地址：的 Frontend AI 是一个 AI 助手，它可以根据用户请求、图像或屏幕截图生成 UI 组件的代码。

4/14/2025 3:45:00 AM 程序员Sunday

一文读懂A2A与MCP如何重塑AI生态

当下的AI世界正处于一个关键节点，就像二战后的国际秩序重建。各家AI企业各自为政，形成了壁垒分明的"数字孤岛"。代理们无法顺畅对话，工具无法共享调用，用户被迫在多个平台间来回切换。

4/14/2025 3:00:00 AM 大数据AI智能圈

Dify+MCP: 泵类设备的预测性维护案例（升级版）

上篇文章中，给大家分享了一个使用 Dify RAGFlow 实现的泵类设备的预测性维护案例，过去两天里有很多盆友在后台私信我了一些实现细节，比如：HTTP 请求的数据存在哪里？ IoT 平台的数据能否直接实时“流”入 Dify？以及如何使用 MCP 的方案实现四个数据源（IoT, CMMS, MES, ERP）的智能查询。

4/14/2025 12:40:00 AM 韦东东

Moonshot AI开源轻量级MoE多模态模型Kimi-VL，2.8B参数媲美SOTA模型！

最近有点忙，没来得及更新，但一直保持着对前沿技术的紧密关注，不得不感叹当今技术日新月异。多模态推理模型进展，现有的开源大型视觉语言模型在可扩展性、计算效率和高级推理能力方面显著落后于纯文本语言模型。 OpenAI的GPT-4o和Google的Gemini等模型能够无缝感知和解释视觉输入，但不开源，DeepSeek-R1等模型虽然采用了MoE架构，但在长上下文推理和多模态任务上仍有不足。

4/14/2025 12:30:00 AM Goldma

本地部署DeepSeek+DiFy平台构建智能体应用

在大模型实际应用落地时候，利用智能体平台，构建本地的向量化知识库，基于RAG知识增强技术和大模型的推理能力，提升效率。本文简要介绍RAG、大模型微调和大模型蒸馏的特点，通用智能体平台，并在本地部署DiFy智能体平台，利用本地部署的DeepSeek模型和知识库构建智能体应用。 1、RAG、微调和蒸馏大模型的落地使用主要有RAG、微调和蒸馏几种方式，每种方式有各自的特点和适用场景。

4/14/2025 12:22:00 AM 大唐小少

阿里全模态Qwen2.5-Omni技术报告万字解读！

Qwen 团队最近发布了一款统一多模态大模型 Qwen2.5-Omni，开放了 7B 版本的权重。能够同时处理文本、图像、音频和视频输入，并以流式方式生成文本和语音响应。下面来详细看下：开源地址：论文地址：：地址： Face：：：官方体验：：：在日常生活中，人类能够同时感知视觉和听觉信息，并通过大脑处理这些信息后，以书写、说话或使用工具等方式进行反馈，从而与世界上的各种生物进行信息交流并展现智能。

4/14/2025 12:20:00 AM Goldma

DataAgent是最容易落地的Agent场景？

数据分析是任何企业的核心需求。在大模型技术蓬勃发展的当下，众多企业都在思考如何将AI能力快速注入现有业务。从目前的市场表现来看，DataAgent(数据智能体)似乎成为了最易落地且价值明显的Agent应用场景。

4/14/2025 12:00:00 AM

Llama 4重测竞技场排名大跳水，网友：社区很难再信任Meta了

Llama 4被曝在大模型竞技场作弊后，重新上架了非特供版模型。但是你很可能没发现它。因为排名一下子从第2掉到了第32，要往下翻好久才能看到。

4/13/2025 5:04:23 PM 量子位

强化学习带来的改进只是「噪音」？最新研究预警：冷静看待推理模型的进展

「推理」已成为语言模型的下一个主要前沿领域，近期学术界和工业界都取得了突飞猛进的进展。在探索的过程中，一个核心的议题是：对于模型推理性能的提升来说，什么有效？什么无效？

4/13/2025 3:10:00 PM 机器之心

资讯热榜

免费！让图片放大不失真的位图转矢量图神器 Tmttool AI应用新纪元：2025中国AI应用排行榜榜单揭晓丨2025年1月 6秒视频10秒生成！全新AI视频神器 Grok Imagine 深度体验+元提示词分享最火、最全的Agent记忆综述，NUS、人大、复旦、北大等联合出品后悔没早发现！教你用谷歌Gemini生成精美PPT（附提示词） GGUF 是什么？一文看懂大模型里最火的模型格式 Sora、可灵、即梦哪家强？AI视频软件深度测评！ OmniParser V2 在 Windows 系统上的详细安装与运行指南

标签云

AI 人工智能 OpenAI AIGC 模型 ChatGPT 谷歌 DeepSeek AI新词 AI绘画大模型机器人数据 Midjourney 开源 Meta 微软智能用户 GPT 学习英伟达 Gemini 智能体技术马斯克 Anthropic 图像 AI创作训练 LLM 论文 AI for Science 代码腾讯苹果算法 Agent Claude 芯片具身智能 Stable Diffusion xAI 蛋白质人形机器人开发者生成式神经网络机器学习 AI视频 3D 字节跳动大语言模型 RAG Sora 百度研究 GPU 生成华为工具 AGI 计算生成式AI AI设计大型语言模型搜索亚马逊 AI模型视频生成特斯拉 DeepMind 场景 Copilot 深度学习 Transformer 架构 MCP 编程视觉

理论

奥特曼：ChatGPT不是AGI！OpenAI最强开源模型直击DeepSeek

AI奥数大奖出炉，英伟达摘桂冠！14B破解34题暴击DeepSeek R1

人类一生所学不过4GB，加州理工顶刊新研究引热议

GPT-4.1偷偷开跑？神秘模型上线三天已被玩疯，网友发现大量OpenAI痕迹

AI Agent 破局：MCP 与 A2A 定义安全新边界

Google ADK，知多少？

4090玩转大场景几何重建，RGB渲染和几何精度达SOTA｜上海AI Lab&西工大新研究

手机实现GPT级智能，比MoE更极致的稀疏技术：省内存效果不减｜对话面壁&清华肖朝军

八个面向前端方向的 AI 编程助手，总有一款适合你！

一文读懂A2A与MCP如何重塑AI生态

最新版Spring Ai实践

Dify+MCP: 泵类设备的预测性维护案例 （升级版 ）

Moonshot AI开源轻量级MoE多模态模型Kimi-VL，2.8B参数媲美SOTA模型！

本地部署DeepSeek+DiFy平台构建智能体应用

阿里全模态Qwen2.5-Omni技术报告万字解读！

DataAgent是最容易落地的Agent场景？

Llama 4重测竞技场排名大跳水，网友：社区很难再信任Meta了

强化学习带来的改进只是「噪音」？最新研究预警：冷静看待推理模型的进展

Dify+MCP: 泵类设备的预测性维护案例（升级版）