上海人工智能实验室
合成数据也能通吃真实世界?首个融合重建-预测-规划的生成式世界模型AETHER开源
近日,上海人工智能实验室(上海 AI 实验室)开源了生成式世界模型 AETHER。 该模型全部由合成数据训练而成,不仅在传统重建与生成任务中表现领先,更首次赋予大模型在真实世界中的 3D 空间决策与规划能力,可助力机器人完成目标导向的视觉规划、4D 动态重建、动作条件的视频预测等复杂任务。 研究团队将几何重建与生成式建模深度融合,首创「重建 — 预测 — 规划」 一体化框架,通过 AETHER 使大模型能够感知周围环境,理解物体之间的位置、运动和因果关系,从而做出更智能的行动决策。
4/20/2025 2:31:00 PM
机器之心
AI革新科研模式,上海AI Lab「AI4S攀登者行动计划」开放申请
驱动科学研究的人工智能(AI for Science,以下简称 AI4S)正逐渐改变科学研究的模式,然而学科之间的「烟囱式」发展模式,既容易造成资源分散和重复投入,也在一定程度上制约颠覆性成果涌现。 同时,由于 AI4S 具有「极宏观拓展、极微观深入、极端条件迈进、极综合交叉」的特性,使得具有重大意义的变革性突破,难以从现有组织模式中诞生——这类突破超出了单一团队的研究能力,需要依赖大规模研究、工程与系统协作,而早期价值又难以被商业风投支持——「AI4S 攀登者行动计划」旨在解决这一难题。 如果你渴望突破 AI4S 传统研究模式的限制,欢迎申请加入「AI4S 攀登者行动计划」,与我们共同推动下一代技术变革。
1/24/2025 5:36:00 PM
机器之心
开源!上海AI Lab视频生成大模型书生·筑梦 2.0来了
AIxiv专栏是AI在线发布学术、技术内容的栏目。过去数年,AI在线AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报道。投稿邮箱:[email protected];[email protected]近日,上海人工智能实验室推出新一代视频生成大模型 “书生・筑梦 2.0”(Vchitect 2.0)。根据官方介绍,书生・筑梦 2.0 是集文生视频、图生视频、插帧超分、训练系统一体化的视
9/23/2024 2:35:00 PM
机器之心
机器人版的「斯坦福小镇」来了,专为具身智能研究打造
首个专为各种机器人设计的模拟互动 3D 社会。还记得斯坦福的 AI 小镇吗?这是斯坦福的 AI 研究者打造的一个虚拟环境。在这个小镇上,25 个 AI 智能体正常生活、工作、社交,甚至谈恋爱,每个智能体都有自己的个性和背景故事。智能体的行为和记忆通过大语言模型来驱动,这些模型能够存储和检索智能体的经历,并根据这些记忆来规划行动。(参见《斯坦福的「虚拟小镇」开源了:25 个 AI 智能体照进《西部世界》》)与之类似,最近,来自上海人工智能实验室 OpenRobotLab 等机构的一批研究者也打造了一个虚拟小镇。不过,
7/22/2024 10:55:00 AM
机器之心
上海AI Lab主任、首席科学家周伯文亮相WAIC,人工智能45°平衡律主张首次曝光
终于,清华大学教授周伯文正式向外界揭晓了自己的新身份——上海人工智能实验室主任、首席科学家。7 月 4 日,2024 世界人工智能大会暨人工智能全球治理高级别会议(WAIC 2024)在上海开幕。上海人工智能实验室主任、首席科学家,清华大学惠妍讲席教授,衔远科技创始人周伯文在 WAIC 2024 全体会议上发表演讲。演讲中,周伯文阐述了他的全新技术主张「人工智能45°平衡律(AI-45° Law)」,以及上海人工智能实验室实现该主张的技术路径「可信 AGI 的因果之梯」。以下为演讲全文。尊敬的各位领导,各位嘉宾,大
7/4/2024 6:36:00 PM
机器之心
低成本、准确、稳健,各类分子通用,上海人工智能实验室开发MD模拟AI新方法
编辑 | 绿萝机器学习原子间势(MLIP)因其兼顾高精度和高效率的优势,在材料、化学、生物学等领域的大尺度原子模拟研究中引起了广泛关注。然而,高性能 MLIP 依赖于大量标记数据,通过从头计算获取这些数据的成本很高。近日,上海人工智能实验室、复旦大学和清华大学的研究团队,提出了一种 MLIP 的几何学习框架 GPIP,利用未标记的构型来提高 MLIP 的性能。研究表明,GPIP 只需少量的计算成本即可显著提高 MLIP 的准确性和泛化性,并且与不同的不变或等变图神经网络架构兼容。该方法增强了 MLIP,并推进了分子
4/12/2024 2:33:00 PM
ScienceAI
详解Latte:去年底上线的全球首个开源文生视频DiT
随着 Sora 的成功发布,视频 DiT 模型得到了大量的关注和讨论。设计稳定的超大规模神经网络一直是视觉生成领域的研究重点。DiT [1] 的成功为图像生成的规模化提供了可能性。然而,由于视频数据的高度结构化与复杂性,如何将 DiT 扩展到视频生成领域却是一个挑战,来自上海人工智能实验室的研究团队联合其他机构通过大规模的实验回答了这个问题。早在去年 11 月,该团队就已经开源了一款与 Sora 技术相似的自研模型:Latte。作为全球首个开源文生视频 DiT,Latte 受到了广泛关注,并且模型设计被众多开源框架
3/28/2024 11:40:00 AM
机器之心
自动驾驶领域,「决策」和「感知」终于握手言和
作者丨郭思编辑丨陈彩娴围绕大模型应用于自动驾驶的讨论热度持续升温,却呈现出愈发复杂而矛盾的现象。 一方面,资本力量的积极投入,行业巨头纷纷抢占先机。 例如,特斯拉近期推出了其“端到端”的全自动驾驶软件FSD v12版本,并已在美国和加拿大地区逐步面向非员工用户提供更新服务。
2/27/2024 10:59:00 AM
郭思
- 1
资讯热榜
标签云
人工智能
OpenAI
AIGC
AI
ChatGPT
AI绘画
DeepSeek
数据
模型
机器人
谷歌
大模型
Midjourney
智能
用户
开源
学习
GPT
微软
Meta
图像
AI创作
技术
论文
Stable Diffusion
Gemini
马斯克
算法
蛋白质
芯片
代码
生成式
英伟达
腾讯
神经网络
研究
计算
Anthropic
3D
Sora
AI for Science
AI设计
机器学习
开发者
GPU
AI视频
华为
场景
人形机器人
预测
百度
苹果
伟达
Transformer
深度学习
xAI
Claude
模态
字节跳动
大语言模型
搜索
驾驶
具身智能
神器推荐
文本
Copilot
LLaMA
算力
安全
视觉
视频生成
训练
干货合集
应用
大型语言模型
亚马逊
科技
智能体
AGI
DeepMind