理论

谷歌、英伟达、OpenAI在列，美国能源部宣布与24家机构达成协议，共同推进「创世纪计划」

编辑丨coisini上个月，美国总统特朗普签署了一项行政命令，启动了「创世纪计划（Genesis Mission⁠）」，该计划指示能源部及其他科学机构积极部署人工智能。今天，美国能源部宣布与 24 家有意合作的机构达成协议，共同推进「创世纪计划」这一历史性国家项目，利用人工智能的力量加速科学发现。产业界代表与能源部部长 Chris Wright、能源部科学副部长兼创世纪计划主任 Darío Gil 博士、白宫科技政策办公室主任 Michael Kratsios 在白宫共同启动了人工智能技术公私合作创新伙伴关系，旨在建设可扩展的国家基础设施，以前所未有的速度拓展科学边界，确保全美共享人工智能发展成果。

12/19/2025 2:03:00 PM

ScienceAI

UniEdit：首个大型开放域大模型知识编辑基准

随着大语言模型（LLM）的广泛应用，它们在医疗、金融、教育等关键行业扮演着愈发重要的角色。然而，一个被忽视的现实是：大模型的知识并不会自动更新，更不总是准确。当模型输出过时信息、错误事实甚至自信满满的“胡说八道”时，如何快速、精准、低成本地纠正它？

12/17/2025 10:44:00 AM

新闻资讯

仅凭一次快照推断细胞动力学，多阶段最优传输模型重建细胞分化轨迹

编辑丨&在单细胞生物学中，一个几乎无法回避的事实是：我们测到的，永远只是某一时刻的细胞状态。无论是单细胞 RNA 测序（scRNA-seq），还是其他高通量手段，细胞一旦被测量就被破坏。研究者看到的是成千上万个细胞在某一瞬间的基因表达「照片」，而不是它们如何一步步走向不同命运的过程。

12/16/2025 11:59:00 AM

ScienceAI

当电子离开理想世界：新模型重构 Landauer 理论，探测真实条件下的弹道电子

编辑丨&在经典物理中，电子穿过金属导线的路径就像一场拥挤的通勤：无数次碰撞、阻力与能量损失。但在某些量子材料中，它们似乎找到了捷径——弹道输运（ballistic transport）：电子从一端射入，几乎不发生散射地滑行到另一端。这意味着电流几乎无损，就像高速公路上只有一辆车，笔直驶向出口。

12/15/2025 12:11:00 PM

ScienceAI

BrainOmni：首个统一脑电磁基础模型，实现跨设备、跨模态的通用脑信号表征

作者丨论文团队编辑丨ScienceAI上海人工智能实验室（上海 AI 实验室）联合清华大学、剑桥大学等合作单位，正式发布 BrainOmni—— 全球首个统一脑电（EEG）与脑磁（MEG）的大脑基础模型。 BrainOmni 通过一种新注意力机制，模拟了脑科学中源重构算法的前向过程，并且首次利用传感器的真实物理属性（坐标、方向、类型）替代通道命名，从而实现跨设备、跨模态兼容。通过 1997 小时 EEG 和 656 小时 MEG 的大规模自监督预训练，BrainOmni 在 9 项下游任务上超越现有基础模型与专用模型，并在未见过的设备上展现强零样本泛化能力。

12/11/2025 2:52:00 PM

ScienceAI

Astribot Lumo-1: 能在物理空间中推理和行动的通用操作大模型

Lumo-1 是一个大规模的视觉-语言-动作（VLA）模型。该模型能够泛化到新的物体、环境和指令 - 包括涉及抽象或间接描述的指令，并且可以高效得适应新任务，包括需要推理或精确操作的任务。 Lumo-1 继承现有视觉-语言模型（VLMs）强大的多模态推理能力，然后逐步将这种能力扩展到关于物理世界的具身推理和真实世界的动作执行。

12/11/2025 2:14:00 PM

新闻助手

OpenAI新论文拆解语言模型内部机制：用「稀疏电路」解释模型行为

在如今的 AI 领域，大多数大语言模型在很大程度上仍以「黑箱」方式工作，即使是专业的研究者也难以完全理解它们的内部计算过程。因此，提升模型的透明度有助于分析和解释大语言模型产生幻觉、行为不稳定或在关键场景做出不可靠判断的潜在原因。就在今天，OpenAI 发布了一项新研究，使用新方法来训练内部机制更易于解释的小型稀疏模型，其神经元之间的连接更少、更简单，从而观察它们的计算过程是否更容易被人理解。

11/14/2025 6:01:00 PM

机器之心

HuggingFace发布超200页「实战指南」，从决策到落地「手把手」教你训练大模型

近期，HuggingFace 发布的超过 200 页的超长技术博客，系统性地分享训练先进 LLM 的端到端经验。博客的重点是 LLM 开发过程中「混乱的现实」。它坦诚地记录了哪些方法有效、哪些会失败，以及如何应对实际工程中遇到的陷阱。

11/9/2025 8:41:00 PM

机器之心

Feed-Forward 3D综述：三维视觉如何「一步到位」

在 3D 视觉领域，如何从二维图像快速、精准地恢复三维世界，一直是计算机视觉与计算机图形学最核心的问题之一。从早期的 Structure-from-Motion (SfM) 到 Neural Radiance Fields (NeRF)，再到 3D Gaussian Splatting (3DGS)，技术的演进让我们离实时、通用的 3D 理解越来越近。然而，以往的方法往往依赖于每个场景的反复优化（per-scene optimization），既慢又缺乏泛化能力。

11/6/2025 5:59:00 PM

机器之心

稠密监督 × 策略内采样：On-Policy Distillation 如何以 1/10 成本训练专家级小模型

大家好，我是肆〇柒。我看到一项来自 Thinking Machines Lab 的前沿研究——《On-Policy Distillation》。这项工作巧妙融合了强化学习的策略内采样优势与知识蒸馏的稠密监督信号，不仅将后训练成本降至传统 RL 的十分之一，还在数学推理、个性化助手和持续学习等关键场景中展现出惊人的效率与稳定性。

11/4/2025 9:42:07 AM

肆零柒

从 “一刀切” 到 “精准筛”：DeepSieve 用四步流水线重构 RAG，告别检索噪声！

在大语言模型（LLMs）主导的AI时代，知识密集型任务始终面临一个核心矛盾：LLM擅长复杂推理，但受限于固定参数无法动态获取最新或领域专属知识；检索增强生成（RAG）虽能链接外部知识，却常因“一刀切”的检索逻辑陷入噪声冗余、推理浅薄的困境。来自罗格斯大学、西北大学与NEC实验室的团队提出的DeepSieve，创新性地将LLM作为“知识路由器”，通过多阶段信息筛选机制，为异构知识源与复杂查询的精准匹配提供了新解法。本文将带您深入拆解这一方案的设计思路与实验效果。

11/4/2025 9:31:03 AM

Goldma

"人工测试"迈向“无人测试"，2025年IT产研升级面临“大变”

出品 | 51CTO技术栈（微信号：blog51cto）一个略显科幻的场景正在软件研发领域悄然上演：开发工程师将代码合并入CI/CD流水线后，一个AI驱动的“质量保障智能体”便被瞬间唤醒。它能够辅助解析需求文档PRD，自主规划测试策略，并高效生成覆盖边界条件的测试用例与测试脚本。面对大模型对复杂领域的理解产生的“幻觉”，通过人机协同和工程化的调优，Agent在发现UI渲染异常或API错误时，能快速自动化地收集日志、分析关键链路，并提交一份完善附带复现路径和初步修复建议的报告。

11/4/2025 9:30:10 AM

诺奖一年后，AI奠基人辛顿再发警告：中国十年后会超越美国；人类在亲自制造外星人；AI带来大规模失业潮将失控，需切尔诺贝利时刻警醒

编辑 | 云昭出品 | 51CTO技术栈（微信号：blog51cto）拿下诺奖一年之后，AI奠基人、“AI教父”辛顿·杰弗里，却成了那个最担忧人工智能的人。这位让神经网络走入现实的科学家，在刚刚放出的采访视频中再次以一种几乎绝望的语气告诉全人类：“我们正在亲手制造外星人。 ”这些外星人不会从星空降临，而是从代码中诞生。

11/4/2025 9:23:20 AM

云昭

LangChain重磅推出DeepAgents CLI：支持持久化记忆的AI编程助手

LangChain团队近日正式发布了DeepAgents CLI，这是一款专为编程、研究和构建AI代理而设计的命令行工具。最大的亮点在于支持持久化记忆系统，让AI助手能够学习和记住信息，并在不同会话之间保持记忆连续性。现在，开发者可以直接从终端轻松创建和运行自定义的DeepAgents代理。

11/4/2025 9:16:14 AM

阿丸笔记

抖音SAIL团队联合港中文MMLab推出SAIL-Embedding：打通「视、文、音」的全模态嵌入

在短视频推荐、跨模态搜索等工业场景中，传统多模态模型常受限于模态支持单一、训练不稳定、领域适配性差等问题。近日，字节跳动抖音 SAIL 团队联合香港中文大学 MMLab 提出 SAIL-Embedding——一款专为大规模推荐场景设计的全模态嵌入基础模型，不仅实现了视觉、文本、音频的统一表征，更在抖音真实业务场景中带来显著效果提升，相关技术报告已正式公开。论文标题：SAIL-Embedding Technical Report: Omni-modal Embedding Foundation Model技术报告：能力概览突破传统局限：全模态工业级优化双管齐下现有多模态嵌入模型主要分为两类：以 CLIP 为代表的双塔架构，虽高效但模态融合浅；以 MLLM 为基础的融合架构，虽语义能力强却多局限于图文模态。

11/4/2025 9:00:00 AM

说话像ChatGPT，统统拉黑！「AI腔」正毁掉社交，奥特曼都受不了

遇到AI，直接拉黑。不是AI，说话像AI的也拉黑！自ChatGPT发布以来，「AI腔」就一直颇受网友诟病。

11/4/2025 8:50:00 AM

现在整个AI投资逻辑都错了！微软CEO首次承认：成排的H100正在积灰，插不上电

真正的瓶颈早已不是芯片，而是电力Satya刚刚透露：整个AI行业的投资逻辑都错了，市场根本没有对相关公司进行重新定价微软有机架成排的H100正在积灰，原因不是不想用，而是不能用——根本没有相应的电力基础设施来支持它们运行这意味着，所有那些根据芯片采购量和GPU数量为这些公司定价的分析师模型，从根本上就是错的。你正在为错误的约束条件估值。瓶颈早已转移，而市场仍在像2023年那样交易重写资本支出方程这完全改写了资本支出的等式当微软斥资500亿美元购买英伟达GPU时，华尔街将其誉为AI投资，并推高了两家公司的股价。

11/4/2025 8:49:47 AM

硅谷甄嬛传爆更，马斯克转发！Ilya动手那一夜，谁捅了奥特曼一刀？

Ilya备忘录还是被马斯克转发出来了！这份10月1日就记录在案的备忘录，简直复杂且幼稚得到难以想象。 AI圈子最顶尖天才、OpenAI的创造者们，在宫斗方面也复杂到一言难尽。

11/4/2025 8:46:22 AM

资讯热榜

免费！让图片放大不失真的位图转矢量图神器 Tmttool AI应用新纪元：2025中国AI应用排行榜榜单揭晓丨2025年1月 GGUF 是什么？一文看懂大模型里最火的模型格式 Sora、可灵、即梦哪家强？AI视频软件深度测评！免注册免费用！17种AI绘图模型一站式体验平台LMArena 可灵、即梦、海螺、Vidu哪家强？4大AI视频神器深度测评后悔没早发现！教你用谷歌Gemini生成精美PPT（附提示词） LangChain V1.0 深度解析：手把手带你跑通全新智能体架构

标签云

AI 人工智能 OpenAI AIGC 模型 ChatGPT 谷歌 DeepSeek AI绘画大模型机器人数据 AI新词 Midjourney 开源 Meta 微软智能用户 GPT 学习智能体技术 Gemini 马斯克英伟达 Anthropic 图像 AI创作训练 LLM 论文代码算法苹果 AI for Science 腾讯 Agent Claude 芯片 Stable Diffusion 具身智能蛋白质 xAI 开发者生成式人形机器人神经网络机器学习 3D AI视频 RAG 大语言模型 Sora 研究百度生成 GPU 字节跳动工具华为 AGI 计算大型语言模型 AI设计搜索生成式AI 视频生成亚马逊 DeepMind AI模型特斯拉场景深度学习 Transformer 架构 MCP Copilot 编程视觉