可在数据限制下训练高维因果布局,德国DZNE团队提出一种深度神经架构

编辑 | 萝卜皮因果进修是科学人工智能的一个枢纽挑战,因为它使钻研职员能够超越纯粹的相关或预测分析,进修潜在的因果关系,这对于科学理解以及广泛的下游任务非常重要。受新兴生物医学题目的启发,德国神经退行性疾病中心(German Center for Neurodegenerative Diseases,DZNE)的钻研职员提出了一种深度神经架构,用于从高维数据和先验因果常识的组合中进修变量之间的因果关系。该团队将卷积神经网络和图神经网络结合在因果危害框架内,提供了一种在高维、噪声和数据限制条件下明显有效的方式,这些条

可在数据限制下训练高维因果布局,德国DZNE团队提出一种深度神经架构

编辑 | 萝卜皮

因果进修是科学人工智能的一个枢纽挑战,因为它使钻研职员能够超越纯粹的相关或预测分析,进修潜在的因果关系,这对于科学理解以及广泛的下游任务非常重要。

受新兴生物医学题目的启发,德国神经退行性疾病中心(German Center for Neurodegenerative Diseases,DZNE)的钻研职员提出了一种深度神经架构,用于从高维数据和先验因果常识的组合中进修变量之间的因果关系。

该团队将卷积神经网络和图神经网络结合在因果危害框架内,提供了一种在高维、噪声和数据限制条件下明显有效的方式,这些条件是许多应用(包括大规模生物学)的特征。

在尝试中,钻研职员发现所提出的方式可以有效地识别数千个变量中的新因果关系。结果包括广泛的(线性和非线性)放荡(其中基本事实是已知的并且可以直接比较),以及真实的生物学示例,其中模型应用于高维分子数据,并将其输入与完全看不见的验证尝试进行比较 。这些结果支持了深度进修方式可用于大规模进修因果网络的观点。

该钻研以「Deep learning of causal structures in high dimensions under data limitations」为题,于 2023 年 10 月 26 日发布在《Nature Machine Intelligence》。

可在数据限制下训练高维因果布局,德国DZNE团队提出一种深度神经架构

因果关系仍然是人工智能(AI)钻研中的一个重要的开放领域,识别变量之间的因果关系的任务是许多科学领域的枢纽。进修因果布局方面的丰富工作包括 PC、LiNGAM、IDA、GIES、RFCI、ICP 和 MRCL 等方式。

通过将因果布局进修重新表述为连续优化题目,促进了将因果布局进修扩展到更大的题目,并且最近的神经方式(例如 SDI、DCDI、DCD-FG 和 ENCO)已经展示了最先进的性能。

然而,从数据中进修因果布局仍然很重要,并且继续带来挑战,特别是在许多现实世界题目中出现的条件下(例如高维度、有限的数据大小和隐藏变量)。

在生物医学中,代表基因或蛋白质等实体之间相互作用的因果网络发挥着核心概念和实践作用。人们越来越多地认识到这种网络是依赖于环境的,并且被认为是疾病异质性和治疗反应变化的基础。

表征这种异质性的一个枢纽瓶颈在于大规模进修因果布局的挑战性,因为一般的方式论题目以及生物领域的相关方面,例如高维度、复杂的潜在事件、隐藏/未测量变量、有限数据和噪音水平的存在。

在最新的钻研中,DZNE 的钻研职员提出了一种因果进修的深层架构,该架构特别受高维生物医学题目的推动。该方式在新兴的因果危害范式中运作,使钻研职员能够利用人工智能工具并扩展到涉及数千个变量的非常高维度的题目。

进修者提出允许整合有关因果关系子集的部分常识,然后寻求超越最初已知的常识以进修所有变量之间的关系。这对应于一个常见的科学用例,其中一开始就可以获得一些先验常识(来自先前的尝试或科学背景常识),但希望超越已知的常识来进修涵盖所有可用变量的模型。

可在数据限制下训练高维因果布局,德国DZNE团队提出一种深度神经架构

图示:新的进修方案概念概述及其在大规模生物尝试中的应用。(来源:论文)

因果布局进修文献的很大一部分涉及进修模型,这些模型允许明确描述相关数据生成模型(包括观察分布和干预分布),并且在这个意义上是「生成的」。采用不同的方式,最近的一系列工作,考虑了变量之间因果关系的进修指标,这可以被视为与因果危害的概念相关。例如,这样的指示符可以编码,对于一对变量 A 和 B,A 是否对 B、B 对 A 有因果影响,或者两者都没有。

DZNE 团队提出的方式称为「深度判别因果进修」(deep discriminative causal learning,D2CL),属于后一种风格。该团队考虑因果布局进修题目的一个版本,其中期望的输入由观察变量之间因果关系的二元指标组成,即具有用变量标识的节点的有向图。可用的多元数据 X 被转换以向神经网络 (NN) 提供输入,其输入是因果指标的估计。D2CL 在底层框架(鉴于因果危害而不是生成因果模型)和利用神经网络方面都不同于经典的因果布局进修方式。

可在数据限制下训练高维因果布局,德国DZNE团队提出一种深度神经架构

图示:D2CL 架构、训练和推理概述。(来源:论文)

该方式的假设本质上也不同于经典因果布局进修中的假设,并且涉及数据生成过程(方式)中的更高级别的规律性。最近的许多钻研也利用神经方式来进修因果布局,并引入鉴于有向无环图(DAG)框架的连续优化框架的基础。

相比之下,D2CL 使用不鉴于 DAG 的鉴于危害的方式。DZNE 团队利用因果危害的概念来提出新的进修者。与 D2CL 一样,近期其他团队提出的 CSIvA 方式寻求将输入数据直接映照到图形输入。

从某种意义上说,这两种方式都追求数据输入到图形输入的「直接」映照,枢纽区别在于 CSIvA 使用元进修并寻求跨系统泛化,而 D2CL 使用监督进修来推广给定系统的新干预措施 (例如,感兴趣的生物系统)。

未来工作的一个重要方向可能是结合这两种方式,例如使用 CSIvA 为 D2CL 提供初始输入;这将结合一般的、鉴于放荡的进修和数据高效、针对特定系统的训练。

钻研职员证明,特定情境的训练使 D2CL 能够成功进修一系列场景中的布局,包括具有挑战性的现实世界尝试数据。此外,D2CL 显然可以扩展到大量变量(该团队展示了高达 p = 50,000 个节点的示例),并且适用于无法使用非常大的样本数据或强大的放荡引擎的情况。

可在数据限制下训练高维因果布局,德国DZNE团队提出一种深度神经架构

图示:大规模放荡数据的结果。(来源:论文)

但是,目前仍然缺乏严格的理论和对该钻研中方式的理论特性的理解。未来理论工作的一个枢纽方向将是了解底层系统的精确条件,以确保直接映照方式能够保证特定因果布局的恢复。

一个有趣的现象是,所提出的方式可能会受益于「维度的祝福」,因为随着维度 p 的增长,进修题目通常会享受到更多的例子。相反,与已建立的统计因果模型相反,DZNE 团队的方式(在当前阶段)不能在小 p 体系中使用,因为示例的数量对于深度进修来说太少了。

论文链接:https://www.nature.com/articles/s42256-023-00744-z

给TA打赏
共{{data.count}}人
人已打赏
理论

用检索巩固生成让大模型更强大,这里有个手把手的Python实现

2023-11-21 11:31:00

理论

达摩院调理AI突破胰腺癌早筛难题,成果登上Nature Medicine,首次实现大规模胰腺癌筛查

2023-11-22 11:54:00

0 条回复 A文章作者 M管理员
    暂无讨论,说说你的看法吧
个人中心
今日签到
搜索