AI在线 AI在线

BrainOmni:首个统一脑电磁基础模型,实现跨设备、跨模态的通用脑信号表征

作者丨论文团队编辑丨ScienceAI上海人工智能实验室(上海 AI 实验室)联合清华大学、剑桥大学等合作单位,正式发布 BrainOmni—— 全球首个统一 脑电(EEG)与脑磁(MEG)的大脑基础模型。 BrainOmni 通过一种新注意力机制,模拟了脑科学中源重构算法的前向过程,并且首次利用传感器的真实物理属性(坐标、方向、类型)替代通道命名,从而实现跨设备、跨模态兼容。 通过 1997 小时 EEG 和 656 小时 MEG 的大规模自监督预训练,BrainOmni 在 9 项下游任务上超越现有基础模型与专用模型,并在未见过的设备上展现强零样本泛化能力。
图片

作者丨论文团队

编辑丨ScienceAI

上海人工智能实验室(上海 AI 实验室)联合清华大学、剑桥大学等合作单位,正式发布 BrainOmni—— 全球首个统一 脑电(EEG)与脑磁(MEG)的大脑基础模型。BrainOmni 通过一种新注意力机制,模拟了脑科学中源重构算法的前向过程,并且首次利用传感器的真实物理属性(坐标、方向、类型)替代通道命名,从而实现跨设备、跨模态兼容。通过 1997 小时 EEG 和 656 小时 MEG 的大规模自监督预训练,BrainOmni 在 9 项下游任务上超越现有基础模型与专用模型,并在未见过的设备上展现强零样本泛化能力。工作自发布以来,收到了来自牛津大学、剑桥大学、法国国家科学研究中心、荷兰 Radboud 大学、美国著名可穿戴脑磁图企业等的关注与合作邀请。

图片

论文链接:https://arxiv.org/abs/2505.18185

开源链接:https://github.com/OpenTSLab/BrainOmni

BrainOmni: 统一 EEG-MEG 的脑基础模型

神经元活动是大脑功能的主要载体,对其精确的测量与理解对探究大脑思考过程、多模态刺激下的信息解码、神经疾病诊断等任务至关重要。脑电图(EEG)和脑磁图(MEG)通过记录神经电流引发的二次电流及磁场,间接测量大脑内部的活动,是两种相对安全便利的非侵入式测量手段,具有广阔的拓展与应用前景。

尽管 EEG 与 MEG 同源于神经电流激发的电磁场,二者长期以来多被分开建模。且由于脑电磁设备的异构特性(通道数、布局、朝向、传感器类型),过往的模型往往只能应用于特定的数据集 / 设备 / 任务,难以学习跨设备跨数据集的泛化知识。近来,一些 EEG 基础模型对脑电信号的大规模预训练进行了探索,然而这些模型大多仍依赖特定的通道命名系统,无法真正兼容全部的脑电数据。同时尽管 MEG 有比 EEG 更高的时空精度,因复杂性高且公开数据稀缺,还缺少基础模型的探索。

BrainOmni 首次在统一特征空间内对 EEG 与 MEG 进行联合预训练,兼容不同脑电磁设备,实现跨模态、跨设备、跨任务、跨被试的通用表征学习,在多种下游任务上表现优越。该工作配套提出 BrainTokenizer,把连续的脑活动压缩并量化为离散神经词元,为大规模 “脑信号语言建模” 奠定基础。

更强跨被试下游性能与零样本跨设备泛化

  • 下游性能领先:跨被试实验设置下,BrainOmni 在运动想象、情绪识别、异常检测、抑郁检测、阿尔茨海默症检测、帕金森检测、 自闭症检测等 9 个下游任务上,取得了优于领域专家模型以及之前的 EEG 基础模型的性能。

图片

表:八个 EEG 数据集上 BrainOmni 与 baseline 的比较。

图片

表:MEG 和 EMEG 数据集上 BrainOmni 与 Baseline 的比较。

  • 零样本跨设备泛化能力:在训练期间未接触的 EEG/MEG 设备上,BrainTokenizer 保持稳定的信号重建效果,体现了模型跨设备的强大泛化能力。

图片

表:BrainTokenizer在零样本设备数据的重建结果。

  • 脑电磁模态互增益:相比于单模态预训练,EEG/MEG 的联合预训练带来了稳定的性能提升,体现了将同源的脑电磁信号联合建模的优势。

图片

表:联合EEG/MEG预训练与单独进行EEG或MEG训练的比较。

“潜在源变量” 建模与神经词元离散,实现异构数据统一与上下文建模

BrainTokenizer:研究团队创新性提出了 Sensor Encoder 模块对脑电磁传感器的物理特性进行可学习建模,通过设备信息的显式注入使得模型实现对多样化设备的兼容。同时团队受脑科学领域源活动估计方法的启发,假定异构的电磁信号由同构的一组神经活动源变量激发,将脑外电磁信号映射到统一特征空间,并将连续的源变量特征离散化,将脑信号转化为神经词元序列。

图片

图:BrainTokenizer架构

BrainOmni:基于 BrainTokenizer 的得到的神经词元,使用掩码语言建模的无监督范式进行自监督学习,使模型学习高层次语义特征,显著提升对神经活动的理解能力。

图片

图:BrainOmni架构

国家 “十五五” 规划已将脑机接口列为未来新经济增长点之一,其战略价值正日益凸显。要实现这一目标,算法、硬件与临床的深度融合至关重要。脑电磁信号因具备无侵入、可穿戴、高时空精度、低延迟等优势,具备广泛的普适性和应用潜力,是拓展脑机接口人群与场景、提升产业价值的关键方向。

BrainOmni 系列基础模型从 AI 角度破解了电磁信号融合、跨设备通用等长期技术瓶颈,并为高价值 MEG 数据稀缺这一行业痛点提供了新的解决途径。上海 AI 实验室正与国内外机构紧密合作,从 “通专融合” 的技术路线持续演进 BrainOmni 系列,在提升性能的同时拓展更多应用领域,进一步融入侵入式脑电、神经影像等更多模态信息。

未来,该系列模型将与上海人工智能实验室的『书生』通专融合基础大模型 Intern-S1与 科学发现平台 Intern Discovery 深度融合,发展为面向脑机接口研究与临床应用、覆盖全模态的 AGI4Science 关键组件之一。

相关资讯

耶鲁、剑桥等开发MindLLM,将脑成像直接转换为文本

编辑 | 萝卜皮将功能性磁共振成像 (fMRI) 信号解码为文本一直是神经科学界面临的一项重大挑战,它有望推动脑机接口的发展,并加深对大脑机制的了解。 然而,现有的方法往往存在预测性能不佳、任务种类有限以及跨受试者泛化能力较差等问题。 针对这一问题,耶鲁大学(Yale University)、达特茅斯学院(Dartmouth College)和剑桥大学(University of Cambridge)的研究人员提出了 MindLLM,一种专为主题无关且用途广泛的 fMRI 到文本解码而设计的模型。
3/4/2025 1:01:00 PM
ScienceAI

解密神经元活动变异性:艾伦研究所与清华揭示大脑状态如何动态调节神经编码

编辑 | 2049神经元对相同刺激的反应为什么会表现出显著差异? 这种变异性是否仅仅是「噪声」? 传统研究往往假设神经活动变异性是静态的,但真实大脑状态在秒级尺度内快速切换,导致编码效率的动态波动。
3/28/2025 2:02:00 PM
ScienceAI

大脑的思考是量子计算,这一猜测有了新证据

几十年来,科学家们一直在探索人脑的计算和思考机制。但人脑的构成太过复杂,包含几百亿个神经元,相当于上万亿块芯片,我们很难一探究竟。
12/27/2022 2:46:00 PM
机器之心