上海人工智能实验室

上海AI Lab发布混合扩散语言模型SDAR：首个突破6600 tgs的开源扩散语言模型

程爽，上海人工智能实验室和浙江大学联培博士生一年级；卞一涵，美国马里兰大学硕士生二年级，上海人工智能实验室实习生；刘大卫，上海人工智能实验室和上海交通大学联培博士生一年级；齐弼卿，上海人工智能实验室研究员（指导老师）大模型推理速度慢、成本高，已成为限制其广泛应用的核心瓶颈。其根源在于自回归（AR）模型「逐字生成」的串行模式。近日，上海人工智能实验室针对该难题提出全新范式 SDAR (Synergistic Diffusion-AutoRegression)。

11/1/2025 8:40:00 PM

机器之心

搜索智能体的关键一课：先立目标，再照镜子

随着 AI 能力不断增强，它正日益融入我们的工作与生活。我们也更愿意给予它更多「授权」，让它主动去搜集信息、分析证据、做出判断。搜索智能体正是 AI 触达人类世界迈出的重要一步。

10/23/2025 1:22:00 PM

机器之心

Litex：面向高效形式化验证的极简语言设计与实践

上海人工智能实验室和复旦大学的研究团队近日开源了 Litex——一门专为降低形式化推理门槛而设计的极简语言。该项目致力于解决传统形式化语言（如 Lean、Coq）学习曲线陡峭的问题，使任何背景的开发者都能够在 1-2 小时内掌握基本的形式化证明编写能力，而非传统的 3-6 个月学习周期。在过去的一年里，Litex 在开源社区引起了持续关注。

10/15/2025 7:19:00 PM

新闻助手

拒绝“熵崩塌”和“熵爆炸”！这项研究让大模型推理成绩飙升

大语言模型在RLVR训练中面临的“熵困境”，有解了！ 2024年以来，以OpenAI o1、DeepSeek-R1、Kimi K1、Qwen3等为代表的大模型，在数学、代码和科学推理任务上取得了显著突破。这些进展很大程度上得益于一种名为RLVR （基于可验证奖励的强化学习）的方法。

10/13/2025 5:12:43 PM

一水

科研AI的进化论！系统梳理600+数据集与模型，上海AI Lab等发布科学大语言模型全景式综述

作者 | 论文团队编辑 | ScienceAI过去几年，大语言模型（LLM）的浪潮席卷学术界与产业界。在科研场景中，它们正从 “工具” 演变为 “合作者”，科学大语言模型（Sci-LLMs）的进展尤为瞩目。然而，科学数据的多模态、跨尺度、强领域语义与不确定性，以及科学知识本身的层次化结构，对 Sci-LLMs 提出了远超通用领域的新要求。

9/4/2025 2:13:00 PM

ScienceAI

应届生看过来！上海AI Lab校招通道已开，100+岗位，700+offer，让科研理想照进现实！

上海人工智能实验室，2026 届全球校园招聘正式启动， 100 职位等你 Pick。欢迎加入上海人工智能实验室一起并肩，Think Bold, Contribute Big，共同定义AGI 未来！寻找这样的同路人（期待你拥有）：AGI 的坚定信仰者：深信伟大突破源于解决根本问题，顶会论文是水到渠成的“自然结果”，而非刻意追逐的终点。

8/21/2025 1:23:00 PM

机器之心

WAIC 2025大黑马，一个「谢耳朵AI」如何用分子式超越Grok-4

当马斯克的 Grok-4 还在用 “幽默模式” 讲冷笑话时，中国的科学家已经在用书生 Intern-S1 默默破解癌症药物靶点的密码 —— 谁说搞科研不能又酷又免费？自从去年 AI 预测与设计蛋白质结构获得诺贝尔奖，AI for Science 这一领域关注度达到了新高度。特别是近两年在大模型强大能力加持下，我们期待能够出现帮助我们作科研的 AI 利器。

7/29/2025 9:04:00 PM

机器之心

真实科研水平集体不及格！全新基准SFE给主流多模态LLM来了波暴击

当前，驱动科学研究的人工智能（AI for Science，AI4S）在单点取得了可观的进展，实现了工具层面的革新，然而要成为「革命的工具」，需要采用「通专融合 AGI」方式。大模型的突破性能力逐步改变科学研究的模式，而大模型在科学领域的深度应用亟需科学的评测支撑。现有科学评测面临着两大痛点：现有测试多聚焦知识记忆，而真实科研需要从原始科学数据感知到复杂推理的全链条能力；天文、地球、生命和材料等领域存在大量未开发的多模态数据分析需求。

7/10/2025 10:20:00 AM

机器之心

合成数据也能通吃真实世界？首个融合重建-预测-规划的生成式世界模型AETHER开源

近日，上海人工智能实验室（上海 AI 实验室）开源了生成式世界模型 AETHER。该模型全部由合成数据训练而成，不仅在传统重建与生成任务中表现领先，更首次赋予大模型在真实世界中的 3D 空间决策与规划能力，可助力机器人完成目标导向的视觉规划、4D 动态重建、动作条件的视频预测等复杂任务。研究团队将几何重建与生成式建模深度融合，首创「重建 — 预测 — 规划」一体化框架，通过 AETHER 使大模型能够感知周围环境，理解物体之间的位置、运动和因果关系，从而做出更智能的行动决策。

4/20/2025 2:31:00 PM

机器之心

AI革新科研模式，上海AI Lab「AI4S攀登者行动计划」开放申请

驱动科学研究的人工智能（AI for Science，以下简称 AI4S）正逐渐改变科学研究的模式，然而学科之间的「烟囱式」发展模式，既容易造成资源分散和重复投入，也在一定程度上制约颠覆性成果涌现。同时，由于 AI4S 具有「极宏观拓展、极微观深入、极端条件迈进、极综合交叉」的特性，使得具有重大意义的变革性突破，难以从现有组织模式中诞生——这类突破超出了单一团队的研究能力，需要依赖大规模研究、工程与系统协作，而早期价值又难以被商业风投支持——「AI4S 攀登者行动计划」旨在解决这一难题。如果你渴望突破 AI4S 传统研究模式的限制，欢迎申请加入「AI4S 攀登者行动计划」，与我们共同推动下一代技术变革。

1/24/2025 5:36:00 PM

机器之心

开源！上海AI Lab视频生成大模型书生·筑梦 2.0来了

AIxiv专栏是AI在线发布学术、技术内容的栏目。过去数年，AI在线AIxiv专栏接收报道了2000多篇内容，覆盖全球各大高校与企业的顶级实验室，有效促进了学术交流与传播。如果您有优秀的工作想要分享，欢迎投稿或者联系报道。投稿邮箱：[email protected]；[email protected]近日，上海人工智能实验室推出新一代视频生成大模型 “书生・筑梦 2.0”(Vchitect 2.0)。根据官方介绍，书生・筑梦 2.0 是集文生视频、图生视频、插帧超分、训练系统一体化的视

9/23/2024 2:35:00 PM

机器之心

机器人版的「斯坦福小镇」来了，专为具身智能研究打造

首个专为各种机器人设计的模拟互动 3D 社会。还记得斯坦福的 AI 小镇吗？这是斯坦福的 AI 研究者打造的一个虚拟环境。在这个小镇上，25 个 AI 智能体正常生活、工作、社交，甚至谈恋爱，每个智能体都有自己的个性和背景故事。智能体的行为和记忆通过大语言模型来驱动，这些模型能够存储和检索智能体的经历，并根据这些记忆来规划行动。（参见《斯坦福的「虚拟小镇」开源了：25 个 AI 智能体照进《西部世界》》）与之类似，最近，来自上海人工智能实验室 OpenRobotLab 等机构的一批研究者也打造了一个虚拟小镇。不过，

7/22/2024 10:55:00 AM

机器之心

上海AI Lab主任、首席科学家周伯文亮相WAIC，人工智能45°平衡律主张首次曝光

终于，清华大学教授周伯文正式向外界揭晓了自己的新身份——上海人工智能实验室主任、首席科学家。7 月 4 日，2024 世界人工智能大会暨人工智能全球治理高级别会议（WAIC 2024）在上海开幕。上海人工智能实验室主任、首席科学家，清华大学惠妍讲席教授，衔远科技创始人周伯文在 WAIC 2024 全体会议上发表演讲。演讲中，周伯文阐述了他的全新技术主张「人工智能45°平衡律（AI-45° Law）」，以及上海人工智能实验室实现该主张的技术路径「可信 AGI 的因果之梯」。以下为演讲全文。尊敬的各位领导，各位嘉宾，大

7/4/2024 6:36:00 PM

机器之心

低成本、准确、稳健，各类分子通用，上海人工智能实验室开发MD模拟AI新方法

编辑 | 绿萝机器学习原子间势（MLIP）因其兼顾高精度和高效率的优势，在材料、化学、生物学等领域的大尺度原子模拟研究中引起了广泛关注。然而，高性能 MLIP 依赖于大量标记数据，通过从头计算获取这些数据的成本很高。近日，上海人工智能实验室、复旦大学和清华大学的研究团队，提出了一种 MLIP 的几何学习框架 GPIP，利用未标记的构型来提高 MLIP 的性能。研究表明，GPIP 只需少量的计算成本即可显著提高 MLIP 的准确性和泛化性，并且与不同的不变或等变图神经网络架构兼容。该方法增强了 MLIP，并推进了分子

4/12/2024 2:33:00 PM

ScienceAI

详解Latte：去年底上线的全球首个开源文生视频DiT

随着 Sora 的成功发布，视频 DiT 模型得到了大量的关注和讨论。设计稳定的超大规模神经网络一直是视觉生成领域的研究重点。DiT [1] 的成功为图像生成的规模化提供了可能性。然而，由于视频数据的高度结构化与复杂性，如何将 DiT 扩展到视频生成领域却是一个挑战，来自上海人工智能实验室的研究团队联合其他机构通过大规模的实验回答了这个问题。早在去年 11 月，该团队就已经开源了一款与 Sora 技术相似的自研模型：Latte。作为全球首个开源文生视频 DiT，Latte 受到了广泛关注，并且模型设计被众多开源框架

3/28/2024 11:40:00 AM

机器之心

自动驾驶领域，「决策」和「感知」终于握手言和

作者丨郭思编辑丨陈彩娴围绕大模型应用于自动驾驶的讨论热度持续升温，却呈现出愈发复杂而矛盾的现象。一方面，资本力量的积极投入，行业巨头纷纷抢占先机。例如，特斯拉近期推出了其“端到端”的全自动驾驶软件FSD v12版本，并已在美国和加拿大地区逐步面向非员工用户提供更新服务。

2/27/2024 10:59:00 AM

郭思

资讯热榜

免费！让图片放大不失真的位图转矢量图神器 Tmttool AI应用新纪元：2025中国AI应用排行榜榜单揭晓丨2025年1月 GGUF 是什么？一文看懂大模型里最火的模型格式 Sora、可灵、即梦哪家强？AI视频软件深度测评！免注册免费用！17种AI绘图模型一站式体验平台LMArena 可灵、即梦、海螺、Vidu哪家强？4大AI视频神器深度测评后悔没早发现！教你用谷歌Gemini生成精美PPT（附提示词） LangChain V1.0 深度解析：手把手带你跑通全新智能体架构

标签云

AI 人工智能 OpenAI AIGC 模型 ChatGPT 谷歌 DeepSeek AI绘画大模型机器人数据 AI新词 Midjourney 开源 Meta 微软智能用户 GPT 学习智能体技术 Gemini 马斯克英伟达 Anthropic 图像 AI创作训练 LLM 论文代码算法 AI for Science 苹果 Agent 腾讯 Claude 芯片 Stable Diffusion 蛋白质具身智能开发者 xAI 生成式神经网络机器学习人形机器人 3D AI视频 RAG 大语言模型 Sora 研究百度生成 GPU 工具华为字节跳动 AGI 计算大型语言模型 AI设计搜索生成式AI 视频生成 DeepMind 亚马逊 AI模型特斯拉场景深度学习架构 Transformer MCP Copilot 编程视觉