编译 | 绿萝2023 年 11 月 7 日，Google Research 高级研讨科学家，Google 团队衔接组学负责人 Viren Jain，在《Nature》发表了题为《人工智能如何更好地理解大脑》（How AI could lead to a better understanding of the brain）的评论文章。论文链接：？这是数学家、理论家和实验学家长期以来一直在问的一个问题——无论是出于创造人工智能 (AI) 的愿望，还是因为只有当数学或计算机能够重现其行为时，才能理解像大脑这样的复杂零碎

谷歌科学家 Nature 评论：人工智能如何更好地理解大脑

编译 | 绿萝

2023 年 11 月 7 日，Google Research 高级研讨科学家，Google 团队衔接组学负责人 Viren Jain，在《Nature》发表了题为《人工智能如何更好地理解大脑》（How AI could lead to a better understanding of the brain）的评论文章。

谷歌科学家 Nature 评论：人工智能如何更好地理解大脑

论文链接：https://www.nature.com/articles/d41586-023-03426-3

计算机可以编程来模仿大脑吗？这是数学家、理论家和实验学家长期以来一直在问的一个问题——无论是出于创造人工智能 (AI) 的愿望，还是因为只有当数学或计算机能够重现其行为时，才能理解像大脑这样的复杂零碎。为了试图回答这个问题，研讨职员自 20 世纪 40 年代以来一直在开发大脑神经网络的简化模型。事实上，当今呆板进修的爆炸式增长可以追溯到受生物零碎启发的早期工作。

然而，这些努力的成果现在使研讨职员能够提出一个稍微不同的问题：呆板进修是否可以用来构建模仿大脑运动的计算模型？

这些发展的核心是越来越多的大脑数据。从 20 世纪 70 年代开始，神经科学家一直在制作衔接组，即神经元衔接和形态图，捕捉大脑在特定时刻的静态表示，之后，这种研讨更加深入。除了这些进步之外，研讨职员从事功能记载的能力也得到了提高，这种记载可以以单个细胞的分辨率丈量神经运动随时间的变化。与此同时，转录组学领域使研讨职员能够丈量组织样本中的基因活性，甚至绘制出该运动发生的时间和地点。

到目前为止，很少有人尝试衔接这些不同的数据源或从同一样本的所有大脑中同时收集它们。但随着数据集的细节水平、大小和数量的增加，特别是对于相对简单的模型生物的大脑，呆板进修零碎正在使一种新的大脑建模办法变得可行。这涉及在衔接组和其他数据上训练人工智能程序，以重现您期望在生物零碎中发现的神经运动。

计算神经科学家和其他人需要解决一些挑战才能开始应用呆板进修来构建所有大脑的模仿。但是，将传统大脑建模技术的信息与经过不同数据集训练的呆板进修零碎相结合的混合办法可以使所有工作变得更加严格和信息更丰富。

脑图谱

绘制大脑图谱的探索始于近半个世纪前，人们在秀丽隐杆线虫身上从事了 15 年的艰苦研讨。在过去的二十年中，自动组织切片和成像的发展使研讨职员更容易得到解剖数据，而计算和自动图像分析的进步也改变了这些数据集的分析。

现在已经为线虫、幼虫和成虫果蝇的所有大脑以及小鼠和人类大脑的一小部分（分别为千分之一和百万分之一）生成了衔接组。

迄今为止制作的解剖图存在重大漏洞。成像办法尚无法与化学突触衔接一起大规模绘制电衔接图。研讨职员主要关注神经元，尽管为神经元提供支持的非神经元胶质细胞似乎在神经零碎的信息流中发挥着至关重要的作用。关于被绘制的神经元和其他细胞中表达的基因以及存在的蛋白质，仍然有很多未知之处。

谷歌科学家 Nature 评论：人工智能如何更好地理解大脑

尽管如此，此类地图已经产生了一些见解。例如，在黑腹果蝇中，衔接组学使研讨职员能够确定负责攻击性等行为的神经回路背后的机制。大脑图谱还揭示了果蝇如何在负责知道自己在哪里以及如何从一个地方到达另一个地方的电路中计算信息。在斑马鱼 (Danio rerio) 幼虫中，衔接组学帮助揭示了气味分类、眼球位置和运动的控制以及导航背后的突触回路的工作原理。

最终可能产生所有小鼠大脑衔接组的努力正在从事中——尽管应用目前的办法，这可能需要十年或更长时间。小鼠大脑几乎是黑腹果蝇大脑的 1,000 倍，后者由大约 150,000 个神经元组成。

除了衔接组学方面的所有这些进展之外，研讨职员还利用单细胞和空间转录组学以不断提高的准确性和特异性捕获基因表达模式。各种技术还允许研讨职员一次记载脊椎动物所有大脑的神经运动几个小时。就斑马鱼幼虫大脑而言，这意味着要对近 100,000 个神经元从事记载。这些技术包括具有荧光特性的蛋白质，这些蛋白质会随着电压或钙水平的变化而变化，以及能够以单细胞分辨率对活体大脑从事 3D 成像的显微镜技术。（以这种方式从事的神经运动记载提供的图像不如电生理学记载准确，但比功能性磁共振成像等非侵入性办法要好得多。）

数学和物理

在尝试模仿大脑运动模式时，科学家主要应用基于物理的办法。这需要应用真实神经元或真实神经零碎部分的行为的数学描述来生成神经零碎或神经零碎部分的模仿。它还需要对尚未通过观察验证的电路方面（例如网络衔接性）做出明智的猜测。

在某些情况下，猜测是广泛的（参见「神秘模型」）但在其他方面，单细胞和单个突触分辨率的解剖图帮助研讨职员反驳和产生假设。

神秘模型

由于缺乏数据，很难评价某些神经网络模型是否捕捉到了真实零碎中发生的情况。

备受争议的欧洲人脑计划于 9 月结束，其最初目标是通过计算模仿所有人脑。尽管该目标被放弃，但该项目确实基于有限的生物丈量和各种合成数据生成程序，对啮齿动物和人类大脑的部分（包括啮齿动物海马模型中的数万个神经元）从事了模仿。

这种办法的一个主要问题是，在缺乏详细的解剖或功能图的情况下，很难评价最终的模仿在多大程度上准确地捕捉了生物零碎中发生的情况。

大约七十年来，神经科学家一直在完善对黑腹果蝇能够计算运动的电路的理论描述。自 2013 年完成以来，运动检测电路衔接组以及随后的更大的飞行衔接组已经提供了详细的电路图，该图支持了有关该电路如何工作的一些假设。

然而，从真实神经网络收集的数据也凸显了解剖驱动办法的局限性。

例如，20 世纪 90 年代完成的神经回路模型包含对大约 30 个神经元的衔接性和生理学的详细分析，这些神经元构成螃蟹（Cancer borealis）口胃神经节（控制动物胃运动的结构）。通过丈量神经元在各种情况下的运动，研讨职员发现，即使对于相对较小的神经元集合，看似微妙的变化，例如引入神经调节剂（一种改变神经元和突触特性的物质），也会完全改变电路的行为。这表明，即使应用衔接组和其他丰富的数据集来指导和约束有关神经回路的假设，今天的数据可能还不够详细，建模者无法捕获生物零碎中正在发生的情况。

这是呆板进修可以提供前进方向的领域。

在衔接组和其他数据的指导下优化数千甚至数十亿个参数，呆板进修模型可以被训练以产生与真实神经网络行为一致的神经网络行为——应用细胞分辨率功能记载从事丈量。

这种呆板进修模型可以结合来自传统大脑建模技术的信息，例如霍奇金-赫胥黎模型（Hodgkin-Huxley model），该模型描述了神经元中的动作电位（跨膜电压的变化）如何启动和传播，以及应用优化的参数衔接图、功能运动记载或为所有大脑得到的其他数据集。或者，呆板进修模型可以包含「黑匣子」架构，其中几乎不包含明确指定的生物学知识，但包含数十亿或数千亿参数，所有参数均经过经验优化。

例如，研讨职员可以通过将零碎神经运动的预计与实际生物零碎的记载从事比较来评价此类模型。至关重要的是，当呆板进修程序得到未经训练的数据时，他们将评价模型的预计如何从事比较——作为评价呆板进修零碎的标准做法。

谷歌科学家 Nature 评论：人工智能如何更好地理解大脑

小鼠大脑中神经元的轴突投射。（来源：Adam Glaser、Jayaram Chandrashekar、Karel Svoboda、艾伦神经动力学研讨所）

这种办法将使包含数千个或更多神经元的大脑建模更加严格。例如，研讨职员将能够评价更容易计算的更简单的模型是否比提供更详细的生物物理信息的更复杂的模型能更好地模仿神经网络，反之亦然。

呆板进修已经以这种方式被用来提高对其他极其复杂的零碎的理解。例如，自 20 世纪 50 年代以来，天气预计零碎通常依赖于精心构建的气象现象数学模型，而现代零碎则是数百名研讨职员对此类模型从事迭代完善的结果。然而，在过去五年左右的时间里，研讨职员已经开发了几种利用呆板进修的天气预计零碎。例如，这些包含与压力梯度如何驱动风速变化以及风速如何使水分穿过大气等相关的假设较少。相反，通过呆板进修优化数百万个参数，以生成与过去天气模式数据库一致的模仿天气行为。

这种做事方式确实带来了一些挑战。即使模型做出了准确的预计，也很难解释它是如何做到的。此外，模型通常无法对未包含在其训练数据中的场景从事预计。经过训练来预计未来几天的天气模型很难推断出未来几周或几个月的预计。但在某些情况下——对于未来几个小时的降雨预计——呆板进修办法已经优于传统办法。呆板进修模型也具有实际优势。它们应用更简单的底层代码，专业气象知识较少的科学家也可以应用它们。

一方面，对于大脑建模，这种办法可以帮助填补当前数据集中的一些空白，并减少对单个生物成分（例如单个神经元）从事更详细丈量的需要。另一方面，随着更全面的数据集的出现，将数据合并到模型中将变得很简单。

想得更大

为了实现这一想法，需要解决一些挑战。

呆板进修程序的好坏取决于用于训练和评价它们的数据。因此，神经科学家应该致力于从样本的所有大脑中获取数据集——甚至从所有身体中获取数据集，如果这变得更加可行的话。尽管从大脑的某些部分收集数据比较容易，但如果底层数据中不存在零碎的许多部分，那么应用呆板进修对高度互连的零碎（例如神经网络）从事建模就不太可能生成有用的信息。

研讨职员还应该努力从同一样本的所有大脑中得到神经衔接和功能记载的解剖图（也许将来还可以得到基因表达图）。目前，任何一个群体都倾向于只专注于得到其中之一，而不是同时得到两者。

由于只有 302 个神经元，线虫的神经零碎可能具有足够的硬连线，使研讨职员能够假设从一个样本得到的衔接图对于任何其他样本都是相同的——尽管一些研讨表明并非如此。但对于较大的神经零碎，例如黑腹果蝇和斑马鱼幼虫的神经零碎，样本之间的衔接组变异非常显著，因此应该根据从同一样本获取的结构和功能数据来训练大脑模型。

目前，这只能在两种常见的模式生物中实现。线虫和斑马鱼幼虫的身体是透明的，这意味着研讨职员可以对生物体的所有大脑从事功能记载，并精确定位单个神经元的运动。在从事此类记载后，可以立即杀死动物，将其嵌入树脂中并切片，并对神经衔接从事解剖丈量。然而，在未来，研讨职员可以扩大可以从事此类组合数据采集的生物体范围，例如，通过开发新的非侵入性办法（可能应用超声波）以高分辨率记载神经运动。

在同一样本中得到此类多模式数据集需要研讨职员之间的广泛合作、对大团队科学的投资以及增加资助机构对更全面的努力的支持。但这种办法是有先例的，例如美国情报高级研讨计划运动的 MICrONS 项目，该项目在 2016 年至 2021 年间得到了 1 立方毫米小鼠大脑的功能和解剖数据。

谷歌科学家 Nature 评论：人工智能如何更好地理解大脑

除了获取这些数据之外，神经科学家还需要就关键建模目标和衡量进展的定量指标达成一致。模型的目标应该是根据过去的状态还是所有大脑来预计单个神经元的行为？单个神经元的运动应该是关键指标，还是应该是数十万个活跃神经元的百分比？同样，什么构成了生物零碎中神经运动的准确再现？正式的、商定的基准对于比较建模办法和跟踪一段时间内的进展至关重要。

最后，为了向包括计算神经科学家和呆板进修专家在内的不同社区提出大脑建模挑战，研讨职员需要向更广泛的科学界阐明哪些建模任务是最优先的，以及应该应用哪些指标来评价模型的性能。WeatherBench 是一个提供评价和比较天气预报模型框架的在线平台，它提供了一个有用的模板。

关键技术的复杂性

有些人会质疑——这是正确的——大脑建模的呆板进修办法在科学上是否有用。尝试理解大脑如何工作的问题是否可以简单地换成尝试理解大型人工网络如何工作的问题？

然而，在涉及确定大脑如何处理和编码感觉刺激（例如视觉和气味）的神经科学分支中应用类似的办法是令人鼓舞的。研讨职员越来越多地应用经典建模的神经网络，其中一些生物细节被指定，并与呆板进修零碎相结合。后者接受大量视觉或音频数据集的训练，以重现神经零碎的视觉或听觉能力，例如图像识别。由此产生的网络与生物网络表现出惊人的相似性，但比真正的神经网络更容易分析和询问。

目前，或许只需询问当前大脑图谱和其他工作的数据是否可以训练呆板进修模型来重现与生物零碎中所见相对应的神经运动。在这里，即使失败也会很有趣——这表明绘图研讨必须更加深入。

{{userData.name}}已认证

谷歌科学家 Nature 评论：人工智能如何更好地理解大脑

脑图谱

数学和物理

想得更大

关键技术的复杂性

NLP 泛化钻研的分类与综述

华人团队获最好论文、最好系统论文，CoRL获奖论文出炉

微软开源 bitnet.cpp 1-bit LLM 推理框架：不靠 GPU 可本地运行千亿参数 AI 模型，能耗最多降低 82.2%

Meta 用 AI 生成北极光图片，遭网友怒喷

秒变Midjourney高手！精选 52 条高级感的 sref 风格代码

中国电信自研 AI 节能系统：年均节电 8 亿度，节约电费 5.2 亿元

英伟达 CEO 黄仁勋展望公司未来：坐拥 5 万名员工、部署 1 亿个 AI 助手

特斯拉人形机器人 Optimus 现场做饮料，员工证实有人在远程控制

成功率提升15%，浙大、碳硅智慧用LLM进行多属性分子优化，登Nature子刊

研究：AI 医疗建议存巨大安全隐患，22% 的回答可能致死