CVPR 2021 | 工夫序列疾病展望的因果隐马尔可夫模型

本文是对发表于计算机视觉和模式识别领域的顶级会议 CVPR 2021的论文“Causal Hidden Markov Model for Time Series Disease Forecasting(工夫序列疾病展望的因果隐马尔可夫模型)”的解读。
该论文由北京大学王亦洲课题组与深睿医疗等单位合作,针对工夫序列疾病展望的问题,提出了因果隐马尔可夫模型描述疾病的动态发展过程,并使用基于 VAE 的变分框架举行学习。通过对图象隐空间举行解耦,去除疾病有关因子与疾病展望的伪相关关系,从而提高展望的准确率和鲁棒性。

项目主页:https://sites.google.com/view/causal-hmm

论文链接:https://arxiv.org/abs/2103.16391

01 研究背景

在医学诊断中,对不可逆型疾病(如视盘萎缩症)举行工夫序列的疾病展望非常重要,对未来疾病发展的展望可以帮助患者举行提前干预,对于疾病的有效控制有很大的意义。

但是这类展望目前存在两个大问题。首先,目前的很多工夫序列疾病展望的办法都是提取所有的时序图象特征来举行未来疾病的展望。然而图象中通常存在很多与该类疾病有关的信息或特征,当加入这些疾病有关的信息举行训练时,会引入伪相关关系,即它们本身与疾病有关,但训练时使用它们参与了疾病的展望,引入了统计上的相关关系。当模型使用这些伪相关的信息对新的漫衍下尝试集的样本举行疾病展望时,很容易导致失败。其次,很多工夫序列的展望办法建立在时序标签完整的情况下。然而由于医学标签标注成本高昂,实际情况下很多时候过去工夫步的疾病标签是缺乏的,标签的缺乏也给未来阶段的疾病展望带来了很大的挑战。

02 办法介绍

CVPR 2021 | 工夫序列疾病展望的因果隐马尔可夫模型

图1. 因果隐马尔可夫模型

为了解决上述问题,本文对工夫序列疾病展望建立了一个基于时序的因果隐马尔可夫模型(Causal-HMM),即针对现有的观测数据,包括每个工夫步的图象数据xt,临床测量数据At (如角膜厚度、角膜曲率等),个体属性数据Bt(如年龄、性别等)以及在未来阶段的疾病标签YT,建立一个描述其相关关系的因果图(如图1),用该因果图去刻画每个工夫步从隐空间到观测值的生成过程。其中隐空间中一部分是与疾病有关的因子zt,一部分是疾病相关的因子st和vt。vt 代表与疾病相关的临床测量数据的隐变量因子,st 代表其他与疾病相关的参与图象生成的因子。而个人属性Bt会对所有的隐变量带来影响。本文对图象在隐空间内举行解耦,旨在通过分离疾病有关因子来去除训练中所带来的伪相关关系。在理论上作家通过可识别性定理(如图2所示)对监督场景下的工夫序列数据给出了隐变量解耦的可识别性保证。

CVPR 2021 | 工夫序列疾病展望的因果隐马尔可夫模型

图2. 可识别性定理

为了学习本文所提出的因果隐马尔可夫模型,作家使用了基于 VAE 的变分框架去学习工夫序列下的图象及临床属性的生成过程以及举行疾病标签的展望(如图3所示)。具体来说,在每个工夫步下先验网络接受个人属性特征及上一个工夫步的隐变量作为输入,得到当前工夫步的隐变量先验;而后验网络的编码器接受当前工夫步的图象及临床属性特征,及上一步的个人属性特征举行输入,相应地得到隐变量后验。同时每一步的解码器会对隐变量举行解码,完成对当前步的图象及临床属性的重构。隐变量的后验和先验通过 KL 距离举行约束。在最后一个工夫步下,通过所提取出的疾病相关的因子举行未来工夫步的疾病展望。

CVPR 2021 | 工夫序列疾病展望的因果隐马尔可夫模型

图3. 左:Causal-HMM的工夫序列网络架构;右:每个工夫步的先验网络,后验网络及生成网络构成

03 实验结果

本文收集了507个个体样本,每个样本包括一到五年级的视网膜图象数据以及相应年级的属性数据,以及六年级的视盘萎缩疾病标签数据。作家对507个样本举行了数据集的划分,其中训练集验证集尝试集的数量分别为300,100,107。为了更好地验证本文办法的泛化性能,作家将训练集验证集和尝试集按照性别划分为两个不同的漫衍,其中前两者数据集的性别漫衍为男女比2:3而后者尝试集性别漫衍为3:1。作家对包括一到五年级的十个所有可能的工夫序列设置下举行了实验,并与多个现有的疾病进展展望和工夫序列展望的办法举行了比较。本文的办法在几乎所有的实验设置及平均情况下的 ACC 和 AUC 指标均高于已有办法(如表1所示),展示了该办法在解决工夫序列疾病展望问题上的优越性。

CVPR 2021 | 工夫序列疾病展望的因果隐马尔可夫模型

表1. 与比较办法RGL, Devised RNN, LogSparse Transformer在一到五年级所有工夫序列上的ACC与AUC结果比较

同时作家对本文的办法举行了消融实验(如表2所示),分别尝试了他们所使用的工夫序列结构(CNN vs Seq VAE, CNN+LSTM vs Seq VAE),属性信息(Seq VAE vs Seq VAE + Att)及隐空间解耦机制(Seq VAE + Att vs Ours)的有效性。

CVPR 2021 | 工夫序列疾病展望的因果隐马尔可夫模型

表2. 针对工夫序列网络结构, 属性信息以及解耦机制的消融实验在一到五年级所有工夫序列上的ACC与AUC结果比较

此外作家设计了一个第二阶段的疾病分类器证明解耦出来的隐变量的鲁棒性,将已经训练好的 Causal-HMM 模型的疾病相关因子和有关的因子分别取出,在训练集验证集及新漫衍下的尝试集上举行展望。疾病有关的因子在新漫衍下的展望准确率有很大下降,而解耦出的疾病相关因子在不同漫衍下的有着稳定和鲁棒的表现(如表3所示)。

CVPR 2021 | 工夫序列疾病展望的因果隐马尔可夫模型

表3. 在一到五年级所有工夫序列上使用不同隐变量(s+v vs z)对疾病举行展望,在训练集,验证集及尝试集上的ACC与AUC结果比较

作家对 Causal-HMM 模型所学习到的隐空间因子s 和 z通过 Grad-CAM 举行了可视化(如图4所示),结果表明疾病相关的因子s在视盘周围显示了高响应,而疾病有关的因子z的高响应处更多地散布在视网膜图象的其他区域如黄斑区等。本文的办法通过将z解耦出来可以去除其和疾病的伪相关关系,从而在不同漫衍下的疾病展望上有更为鲁棒的表现。

CVPR 2021 | 工夫序列疾病展望的因果隐马尔可夫模型

图4. 不同隐变量(s vs z)的特征图可视化

04 结  语

本文针对工夫序列疾病展望问题提出了一个因果隐马尔可夫模型举行未来阶段的疾病展望。为了保证模型的泛化性能,作家对每个工夫步下的隐空间举行了显式的解耦和分离,并通过可识别性的结果对该解耦机制给出了理论保证。针对因果隐马尔可夫模型,作家提出了一个新的工夫序列变分框架举行该模型的学习和推断。实验上,作家将其办法应用在了视盘萎缩疾病的时序展望问题中,并和当前现有的最优办法举行了比较,在新的尝试集漫衍下取得了更优越的性能,展示了该办法的有效性和鲁棒性。

参考文献

[1] Judea Pearl. Causality. Cambridge university press, 2009.

[2] Maxime Louis, Raphael Couronne, Igor Koval, Benjamin Charlier, and Stanley Durrleman. Riemannian geometry learning for disease progression modelling. In IPMI 2019.

[3] Ilyes Khemakhem, Diederik P Kingma, and Aapo Hyvärinen. Variational autoencoders and nonlinear ICA: A unifying framework. In AISTATS 2020.

[4] Xinwei Sun, Botong Wu, Chang Liu, Xiangyu Zheng, Wei Chen, Tao Qin, and Tie-yan Liu. Latent causal invariant model. arXiv preprint arXiv:2011.02203, 2020.

图文 | 李静

Computer Vision and Digital Art (CVDA)

原创文章,作者:北京大学前沿计算研究中心,如若转载,请注明出处:https://www.iaiol.com/news/cvpr2021-gong-fu-xu-lie-ji-bing-zhan-wang-de-yin-guo-yin-ma/

(0)
上一篇 2022年 7月 18日 下午5:02
下一篇 2022年 7月 18日 下午5:04

相关推荐

  • 科研产业即将迎来AI赋能拐点

    「机器之心2021-2022年度AI趋势大咖说」聚焦「驱动未来的AI技术」与「重塑产业的AI科技」,推出线上分享,共邀请近40位AI领域知名学者、产业专家及企业高管通过主题分享及多人圆桌等形式,与行业精英、读者、观众共同回顾 2021年中的重要技术和学术热点,盘点AI产业的年度研究方向以及重大科技突破,展望2022年度AI技术发展方向、AI技术与产业科技融合趋势。

    2022年 7月 22日
  • 把轮子装在膝盖上,「机器羊」能走能滑、还载起了人和货

    四足机器人不一定是机器狗,也可能是「机器羊」。

    2022年 3月 29日
  • 地平线征程6正式发布:2024年开启量产,2025年交付超10款车型

    官宣10家首批量产合作车企,地平线征程6发布即爆款

    AI 2024年 4月 25日
  • SENSORO 与柬埔寨国防部通讯局签署单干体谅备忘录

    2021 年 1 月 20 日,SENSORO(北京升哲科技有限公司)与柬埔寨国防部通讯局单干体谅备忘录签字仪式在金边举行。柬埔寨国防部通讯局局长 KOSAL Sovanvisal、SENSORO(柬埔寨)科技有限公司 CEO 赵龙作为单方代表共同签约。根据单干体谅备忘录,SENSORO 与柬埔寨国防部基于友好单干共识,单方将不断深化经验分享、加大单干力度,持续拓展单干畛域、打造单干新亮点,助力柬埔寨建造成为高端定位的新型聪明都会。自 2018 年以来,柬埔寨国防部曾多次到访 SENSORO,并持续推动双

    2021年 1月 21日
  • 产业实践推动科技创新,京东科技集团3篇论文当选ICASSP 2021

    ICASSP 2021将于2021年6月6日-11日在加拿大多伦多拉开序幕,凭借在语音技术领域的扎实积累和前沿创新,京东科技集团的3篇论文已经被 ICASSP 2021接收。

    2021年 8月 25日
  • 是时候进修机械进修零碎安排了!斯坦福CS 329S开课,课件、笔记同步更新

    这是一门新的课程——在进修了算法、框架等内容后,是时候深入了解一下「机械进修零碎安排」了!

    2021年 1月 26日
  • 模型鲁棒性好不好,复旦大学一键式评测平台告诉你

    复旦大学自然言语处置惩罚实验室发布模型鲁棒性评测平台 TextFlint。该平台涵盖 12 项 NLP 使命,囊括 80 余种数据变形步骤,花费超 2 万 GPU 小时,进行了 6.7 万余次实验,考证约 100 种模型,选取约 10 万条变形后数据进行了言语合理性和语法正确性人工评测,为模型鲁棒性评测及提升提供了一站式解决方案。

    2021年 4月 6日
  • 从质料计划分解,到催化剂创新、碳中和,清华王笑楠团队探索「AI+质料」前沿与落地

    作者 | 清华大学王笑楠编辑 | 凯霞在当今科技飞速发展的时代,新质料的钻研与开发已成为推动迷信进步和工业革命的关键力量。从能源存储到信息技术,再到生物医药,创新质料的计划、分解及其功能表征是实现这些畛域突破的基石。随着人工智能(AI)技术的不断进步,其在新质料钻研中的集成利用已逐步开启一个全新的钻研范式,成为超越传统研发模式的新质生产力,特别是在质料的计划、分解和表征过程中,AI 的助力大大提高了钻研效率和精度。「17 岁上清华,27 岁做博导,30 岁回归清华,90 后科研女神,入选 2023 全球学者终身学术

    AI 2024年 4月 29日
  • ICML 2021 | 鉴于拆卸的视频无监视零件宰割

    本文是第三十八届国际机器进修会议(ICML 2021)入选论文《鉴于拆卸的视频无监视零件宰割(Unsupervised Co-part Segmentation through Assembly)》的解读。
    该论文由北京大学陈宝权-刘利斌研究团队与山东大学、北京电影学院未来影像高精尖创新中心合作,提出了一种无监视的图像零件宰割法子,创新性地采用了将零件宰割历程和零件拆卸历程相结合的自监视进修思路,利用视频中的运动信息来提取潜在的零件特性,从而实行对物体零件的有意义的宰割。

    2022年 7月 18日

发表回复

您的电子邮箱地址不会被公开。 必填项已用 * 标注