每当人类或呆板进修更好地完成一项恣意时,总会留下一系列的物理变化,比如人类大脑中的细胞或呆板进修算法中的数值会发生相应的变化,这些变化是提高其性能的基础。但是,大脑或呆板等系统如何准确地计算出需要做出哪些改变并不简单,在这个课题中,大脑或人工智能系统必须查明其 pipeline 中错误的原因,然后做出必要的改变,这一进程可称之为信誉分派课题。
更简单地说:这好比一场推卸责任的游戏,需要找出哪部分出错了。在呆板进修(ML)领域,AI 工程师使用「反向传递」这种强大算法处理了呆板的信誉分派课题,该算法在 1986 年随着 Geoffrey Hinton、David Rumelhart 和 Ronald Williams 的工作而普及。现在,反向传递算法在最成功的 AI 系统(深度神经网络)中为网络进修提供了主要的进修动力。现在看来,呆板进修可以采用反向传递处理信誉分派课题,那么大脑中有没有等价的机制处理信誉分派课题呢?今年 5 月发表在《自然 – 神经科学》上的一篇论文《Burst-dependent synaptic plasticity can coordinate learning in hierarchical circuits》中,研究者们终于找到了可以生活在活体大脑中并从事实时工作的等价物。
论文地址:https://www.nature.com/articles/s41593-021-00857-x这篇论文由来自加拿大渥太华大学的 Richard Naud 以及麦吉尔大学的 Blake Richards 等研究者参与撰写,他们揭示了一种新的大脑进修算法模型,该模型可以模拟反向传递进程。
麦吉尔大学的 Blake Richards(左)和渥太华大学的 Richard Naud(右),他们提出了一个新的大脑进修模式,最终可以处理人类大脑的信誉分派课题。Naud 表示:「这篇论文的主要目标是表明呆板正在从事的进修方式可以通过生理进程来逼近。」来自柏林洪堡大学的实验神经科学家 Matthew Larkum 表示:「来自更理论化方面的想法可以推动比较困难的实验得以从事,在我看来,这篇论文超越了这一标准,这在生物学上是合理的,可能会带来很大的影响。」然而,人类和呆板实现信誉分派课题的进程并不完全相同。对于呆板来说,当训练一个识别图象的深度神经网络时,它会分成两个阶段从事:首先是前向传递,然后是反向传递,期间网络会从事「进修」这一进程。在第一阶段,输入层中的神经元编码图象的特征并将其传递,然后隐藏层中的神经元执行计算并将它们的结果传递到输入层,输入层对输入图象从事预测。比如输入一张狗的图象,模型预测出来是一张猫,这时反向传递算法通过调整衔接神经元的权重来处理课题,使得模型预测结果是一只狗。
反向传递示意图。大脑如何逼近反向传递?几十年来,研究人员一直试图弄清楚大脑是如何执行类似反向传递操作来处理信誉分派课题的。反向传递本身在生物学上是不合理的,因为真正的神经元不可能停止处理来自外部的信息,以等待反向传递。如果大脑是这样工作的,那我们的视觉、听觉或其他感官就会丧失。Naud 和 Richards 的新模型可以处理这个课题,他们通过对神经元之间从事相互交流的传统理解做了一个简单的改变来实现。我们知道神经元就像比特一样,只有两个输入,要么向另一个神经元发送电活动的尖峰旗号(spike of electrical),要么不发送,即 1 或 0。但神经元也可以快速连续地发送「突发(burst)」尖峰旗号。事实证明,这种方式可以改变神经元之间的衔接,并使「突发」成为处理信誉分派课题的一种选择。
突发相关的可塑性规则。在新模型中,该团队认为神经元会突发第三个输入旗号,即神经元不停地发送「突发」旗号 1,这些旗号相隔很近,实际上旗号就变成了 2。2 不是对外部信息从事编码的,而是充当「教学旗号」,告诉其他神经元根据电路顶部产生的误差,是加强还是削弱它们之间的衔接。但要想让这个教学旗号在不「暂停」感官处理的情况下处理信誉分派课题,研究者的模型还需要另一个关键部分。他们提出,神经元的顶部和底部有不同的间隔空间,它们以完全不同的方式处理神经代码。「我们的模型表明你真的可以有两个旗号,一个上升旗号和一个下降旗号,它们可以相互传递,」Naud 说。
突发相关的可塑性可以处理异或(XOR)恣意中的信誉分派课题。研究者假设,在神经元顶端接收输入旗号的树状分支只监听突发旗号——内部教学旗号,以调整神经元之间的衔接并减少误差。调整自上而下从事,就像在反向传递中一样,因为在他们的模型中,顶部的神经元正在调节其下方神经元发送突发旗号的可能性。研究者表示,当网络有更多的突发时,神经元往往会增加其衔接的强度,而当突发旗号不那么频繁时,衔接的强度往往会降低。这个思路是这样的,突发旗号告诉神经元它们应该在恣意期间处于活跃状态,以加强它们之间的衔接,这样做可以减少误差,而如果没有突发旗号,则告诉神经元它们应该处于非活动状态并且可能需要削弱它们之间的衔接。
周期性和反馈衔接的突发依赖可塑性通过线性化和调整反馈来促进基于梯度的进修。与此同时,神经元底部的分支将突发旗号视为单个尖峰旗号,即正常的外部旗号,这使得旗号能够继续在回路中向上发送感官信息而不受干扰。「现在回想起来,这个想法似乎是合乎逻辑的,」苏黎世大学和苏黎世联邦理工学院的计算神经学家 João Sacramento 表示。这项研究有什么意义?过去,其他研究者也试图采用类似的逻辑。20 年前,来自宾夕法尼亚大学的 Konrad Kording 以及奥斯纳布吕克大学 Peter König 提出了一个双室(two-compartment)神经元进修架构。但是该提案缺乏与生物学相关的许多具体细节,而且这只是一个提案,他们无法证明这个双室神经元进修架构是否能真正的处理信誉分派课题。Kording 表示,当时他们只是缺乏测试这些想法的能力。他认为 Richard Naud 以及 Blake Richards 等人的研究是很了不起的工作。如今借助算力,Naud、Richards 和他们的合作者成功地模拟了他们的模型,其中突发神经元(bursting neurons)扮演了进修规则的角色。他们表明,突发神经元处理了 XOR 经典恣意中的信誉分派课题,该恣意需要进修在两个输入之一为 1 时做出响应。此外,研究结果还表明,使用他们的突发规则构建的深度神经网络可以近似反向传递算法在具有挑战性的图象分类恣意上的性能, 不过该研究仍有改进的余地。这对于 AI 研究人员来说也很兴奋,因为弄清楚大脑如何近似反向传递,反过来又可以改善 AI 系统的进修方式。「如果我们能够深入理解这个进程,那么这最终可能会导致系统能够像大脑一样高效地处理计算课题,」来自荷兰拉德堡德大学 Donders 研究所人工智能系主任 Marcel van Gerven 表示。原文链接:https://www.quantamagazine.org/brain-bursts-can-mimic-famous-ai-learning-strategy-20211018/
原创文章,作者:机器之心,如若转载,请注明出处:https://www.iaiol.com/news/31242