Emu3

智源研究院推出Emu3等“悟界”系列大模型

智源研究院推出Emu3等“悟界”系列大模型

在刚刚闭幕的第七届 “北京智源大会” 上，智源研究院重磅推出了一系列名为 “悟界” 的大模型。这些模型的发布标志着人工智能领域又一次技术的飞跃，吸引了众多科技爱好者的目光。此次发布的模型包括原生多模态世界模型 Emu3、脑科学多模态通用基础模型见微 Brainμ、以及跨本体的具身大小脑协作框架 RoboOS2.0和具身大脑 RoboBrain2.0。

6/6/2025 4:00:55 PM AI在线

智源大会发布“悟界”系列大模型，加速迈向物理AGI时代

智源大会发布“悟界”系列大模型，加速迈向物理AGI时代

在今日举行的 2025 北京智源大会上，北京智源人工智能研究院正式发布“悟界”系列大模型，全面展示其在物理通用人工智能（AGI）方向的最新研究成果与战略布局。 “悟界”系列意在突破虚实边界、赋能物理世界，涵盖四款前沿模型：多模态世界模型Emu3、脑科学模型见微Brainμ、具身智能大脑RoboBrain 2. 0 以及微观生命模型OpenComplex2，构建了从世界理解、神经建模到具身控制和生命模拟的全链条AI体系。

6/6/2025 12:01:06 PM AI在线

智源发布原生多模态世界模型 Emu3，宣称实现图像、文本、视频大一统

智源发布原生多模态世界模型 Emu3，宣称实现图像、文本、视频大一统

感谢智源研究院今日发布原生多模态世界模型 Emu3。该模型只基于下一个 token 预测，无需扩散模型或组合方法，即可完成文本、图像、视频三种模态数据的理解和生成。官方宣称实现图像、文本、视频大一统。

10/21/2024 11:25:48 PM 沛霖（实习）

视频、图像、文本，只需基于下一个Token预测：智源Emu3发布，验证多模态模型新范式

视频、图像、文本，只需基于下一个Token预测：智源Emu3发布，验证多模态模型新范式

OpenAI 前首席科学家、联合创始人 Ilya Sutskever 曾在多个场合表达观点：只要能够非常好的预测下一个 token，就能帮助人类达到通用人工智能（AGI）。虽然，下一 token 预测已在大语言模型领域实现了 ChatGPT 等突破，但是在多模态模型中的适用性仍不明确，多模态任务仍然由扩散模型（如 Stable Diffusion）和组合方法（如结合 CLIP 视觉编码器和 LLM）所主导。2024 年 10 月 21 日，智源研究院正式发布原生多模态世界模型 Emu3。

10/21/2024 1:11:00 PM 机器之心

又一届「AI春晚」拉开序幕！智源大模型集体爆发了

又一届「AI春晚」拉开序幕！智源大模型集体爆发了

每一年的智源大会不仅是分享前沿 AI 科技成果的平台，更为国内外业内人士提供了一个交流的舞台。果然，2024 智源大会又为我们带来了诸多惊喜。一年一度的国内「AI 春晚」—— 智源大会又一次拉开了序幕。20 个不同主题的论坛、百场精彩报告让现场和线上的观众目不暇接，切实感受到了当下 AI 尤其是大模型对内容创作、生产办公、机器人、生物医疗等千行百业的深度赋能。在这场「AI 内行顶级盛会」上，不仅有 Llama、Sora 等大模型及 DiT 架构的作者参与交流，详解他们的研究成果；还有百度、零一万物、百川智能、智谱

6/16/2024 6:12:00 PM 机器之心

资讯热榜

免费！让图片放大不失真的位图转矢量图神器 Tmttool AI应用新纪元：2025中国AI应用排行榜榜单揭晓丨2025年1月 6秒视频10秒生成！全新AI视频神器 Grok Imagine 深度体验+元提示词分享最火、最全的Agent记忆综述，NUS、人大、复旦、北大等联合出品后悔没早发现！教你用谷歌Gemini生成精美PPT（附提示词） GGUF 是什么？一文看懂大模型里最火的模型格式 Sora、可灵、即梦哪家强？AI视频软件深度测评！ Mac也能跑Qwen3，一文看懂本地部署qwen 3配置要求

标签云

AI 人工智能 OpenAI AIGC 模型 ChatGPT 谷歌 DeepSeek AI新词 AI绘画大模型机器人数据 Midjourney 开源 Meta 微软智能用户 GPT 学习英伟达 Gemini 智能体技术马斯克 Anthropic 图像 AI创作训练 LLM 论文 AI for Science 代码腾讯苹果算法 Agent Claude 芯片具身智能 Stable Diffusion xAI 蛋白质人形机器人开发者生成式神经网络机器学习 AI视频 3D 字节跳动大语言模型 RAG Sora 百度研究 GPU 生成华为工具 AGI 计算生成式AI AI设计大型语言模型搜索亚马逊 AI模型视频生成特斯拉 DeepMind 场景 Copilot 深度学习 Transformer 架构 MCP 编程视觉