AI在线 AI在线

江大团队融合对比学习与超图建模,预测1.7万条食物–微生物–疾病关联,AUPR提升8.9%

编辑丨%在零食界,总会有些心照不宣的默契:比如说掉在地上三秒内捡起来就没事的三秒定律,或者说不干不净吃了没病的俗语。 虽然话这么说,但是随着这些食物而进入身体的细菌,真的有在潜移默化地改变我们体内的微生物生态,影响身体健康。 这个被称为「食物–微生物–疾病」(Food–Microbe–Disease, FMD)网络的世界,复杂得远超想象,并且现有的对此预测方法仍然有限。
图片

编辑丨%

在零食界,总会有些心照不宣的默契:比如说掉在地上三秒内捡起来就没事的三秒定律,或者说不干不净吃了没病的俗语。虽然话这么说,但是随着这些食物而进入身体的细菌,真的有在潜移默化地改变我们体内的微生物生态,影响身体健康。

这个被称为「食物–微生物–疾病」(Food–Microbe–Disease, FMD)网络的世界,复杂得远超想象,并且现有的对此预测方法仍然有限。考虑到这些,江南大学的一支团队提出了一种轻量级、单视角、基于对比学习的超图神经网络,来补全相关领域的缺漏。

该研究以「A lightweight single-view contrastive learning hypergraph neural network for food–microbe–disease association prediction」为题,于 2025 年 11 月 4 日刊登于《BMC Bioinformatics》。

图片

论文链接:https://bmcbioinformatics.biomedcentral.com/articles/10.1186/s12859-025-06283-1

关系链上的观察者

在人体肠道内,寄居着一个包含了大约 100 万亿个微生物生态系统,统称为肠道微生物群。这些微生物对于维持肠道稳态和通过产生各种代谢物促进宿主健康至关重要。

关于肠道微生物与疾病实体之间的关联,现有的研究主要使用传统的图神经网络(GNNs)。这些图神经网络受限于它们的成对关系,妨碍了它们在捕捉微生物系统(如食物-微生物-疾病关联)的高阶复杂性的表现。

该团队着眼于理解食物-微生物-疾病相互作用,利用超图所带来的强大框架,引入轻量化超图神经网络架构,并结合对比学习(contrastive learning)思路,让模型能在有限数据中自动捕捉稳定模式。

图片

图 1:LSCHNN 的工作流程。

研究团队首先构建了一个规模庞大的 FMD 数据集:

  • 190 种食物

  • 219 种肠道微生物

  • 163 种疾病

共收集并整合 17,065 条已知关联

接着,实验团队在 FMD 超图上实现单视图对比学习方法,以增强学习表示的区分能力。这种方式同样能免除模型受多视图对比学习中可能出现的噪声和过拟合问题的干扰。

最后,涉及超图卷积层的编码与使用多层感知机(MLP)构建的解码将会将交互特征映射为得分,凭此调整网络参数。

验证与结果

在交叉验证中,LSCHNN 在主要评价指标 AUPR(精确率–召回率曲线下面积)上提升了 8.91%,优于包括 GraphSAGE、HGCN、FMD-GCN 等多种对照模型。

更值得一提的是,它能在稀疏数据与未见组合下保持稳健预测。单视图对比学习在增强 LSCHNN 处理稀疏数据方面有着重要作用,并且,它还可以显著提高其学习能力。超图卷积在模型的预测性能中同样也起着关键作用。

图片

图 2:在五个不同模型上进行的消融实验结果。

案例研究中,团队以大肠杆菌与双歧杆菌为例,与五个基线模型进行了对比分析。结果显示,LSCHNN 在大肠杆菌中发现了 131 个新的 FMD 三元关联,其中 114个(87.02%)仅有它发现。在双歧杆菌的测试中则是完成了 202 个新关联(含 182 独家发现)。

个性化饮食干预

近年来,肠道微生物在人类健康中的关键作用已被研究证实,而 LSCHNN 的框架让研究者能从三方关系中找到因果线索:哪些食物通过改变哪些菌群,影响哪些疾病。

LSCHNN 不仅限于 FMD 预测,还扩展到药物-微生物-疾病网络,展示了良好的泛化性能。在未来的工作中,团队表示,他们将会引入更多维度的实体特征,整合更全面、更广泛的生物相互作用网络,并完善图注意力机制。

相关资讯

53%性能全面提升,Ayu新模型横扫传统工具,分泌蛋白预测效率再翻倍

编辑丨&微生物是驱动元素循环的引擎,它们分泌蛋白质以寻求生活环境。 现阶段还缺乏有效的计算方法来研究分泌蛋白。 表征分泌组的另一种方法是将现代机器学习工具与蛋白质组对海洋环境的进化适应变化相结合。
4/3/2025 2:36:00 PM
ScienceAI

多中心医学图像分析模型,VFMGL框架破解数据孤岛难题,93.4% Dice系数的卓越表现

编辑丨&在众多中下游任务中,收到广泛而多样的数据集训练的基础模型表现出的强大性能,在医疗领域表现却不甚得人心。 受到到数据量、异质性和隐私问题等问题的严重阻碍,基础模型得不到更进一步的发展。 桂林航空航天大学联合江门市中心医院等推出了 Vision Foundation Model General Lightweight(VFMGL)框架,以促进各种医疗任务的专家临床模型的去中心化构建。
3/5/2025 5:48:00 PM
ScienceAI

11天实现18种广谱抗菌素设计,体外验证成功率94.4%,浙大侯廷军等用LLM方法从头设计AMP

编辑 | 萝卜皮大型语言模型 (LLM) 在化学和生物医学研究中取得了显著进展,可作为各种任务的多功能基础模型。 浙江大学侯廷军、谢昌谕以及南方医科大学姜志辉等课题组组成的联合团队提出了 AMP-Designer,这是一种基于 LLM 的方法,用于快速设计具有所需特性的抗菌肽 (AMP)。 在 11 天内,AMP-Designer 实现了 18 种具有广谱抗革兰氏阴性细菌活性的 AMP 的从头设计。
3/7/2025 1:11:00 PM
ScienceAI
  • 1