AI在线 AI在线

Nature | 20年后你会患上哪些疾病?AI准确预测超1000种疾病患病风险,助力预防

编辑丨coisini古籍云:「上医治未病」,意思是医术最高明的医生擅长预防疾病。 在综合评估个人健康风险状态的基础上,一些疾病可以通过一定的防治干预手段来阻断发展。 现在,人工智能(AI)可以为人类预测疾病风险了!
图片

编辑丨coisini

古籍云:「上医治未病」,意思是医术最高明的医生擅长预防疾病。在综合评估个人健康风险状态的基础上,一些疾病可以通过一定的防治干预手段来阻断发展。

现在,人工智能(AI)可以为人类预测疾病风险了!

来自德国癌症研究中心(DKFZ)、欧洲分子生物学实验室(EMBL)、哥本哈根大学等机构的研究团队开发了一款新型 AI 工具 ——Delphi-2M,可以预测一个人罹患 1000 多种疾病的风险,在某些情况下甚至可以提前几十年预测。

研究论文以《Learning the natural history of human disease with generative transformers》为题发表在《Nature》上。

图片

论文地址:https://www.nature.com/articles/s41586-025-09529-3

Delphi-2M

关于疾病预测,现有算法大多针对特定疾病,而对多重疾病建模仍是一个难题。根据国际疾病分类第十版(ICD-10)编码系统,人类疾病谱包含超过 1000 种顶层诊断分类。

除诊断数量庞大外,多重疾病建模挑战还包括:对既往事件间时间依赖性的建模、整合预后相关多元数据等。

研究团队通过改进 GPT(生成式预训练 transformer)架构,构建了能够模拟人类疾病进展的模型 ——Delphi-2M。该模型基于 40 万英国生物银行参与者的数据训练,并使用超大规模外部数据(参数未调整)进行验证。

图片

根据个体既往病史,Delphi-2M 能够预测 1000 多种疾病的发病率,并且准确度与现有单病种模型相当。

图片

Delphi-2M 还可为个体提供长达 20 年的潜在疾病风险估计,利用健康记录和生活方式因素来估算其未来 20 年内罹患癌症、皮肤病和免疫系统疾病等疾病的可能性。

图片

研究团队还从可解释 AI 的角度对 Delphi-2M 预测的内在逻辑进行了分析:

图片

值得一提的是,基于 Transformer 的架构让 Delphi-2M 能够相对简便地整合附加数据层,即时纳入更多生活方式数据、自报健康状况、处方记录、检测指标等等。

总体而言,Delphi-2M 展现出卓越的适应性,既能胜任预测性和生成性健康任务,又可应用于人群级数据集,揭示疾病事件间的时间依赖性。

外部验证

为了评估 Delphi-2M 模型在未知人群中的泛化能力,研究团队直接迁移了基于英国生物银行数据训练得到的 Delphi-2M 模型权重,在超大规模外部数据上进行了验证评估,未进行任何重训练或参数调整。

结果显示:模型平均 AUC 值为 0.67(标准差 0.09),略低于在英国生物银行数据纵向测试中的表现(0.69,标准差 0.09)。虽然准确度略有下降,但 Delphi-2M 能准确反映多重病症的真实演变规律。

图片

但研究团队坦言:Delphi-2M 还存在一些局限性,例如,健康数据源的多样性影响了模型预测。

总的来说,Delphi-2M 有望增强个性化健康风险认知,为精准医疗方法提供依据。不过,使用 AI 模型进行推断预测时需保持审慎,此类模型更适合作为现有诊断流程的补充工具而非替代方案。

感兴趣的读者可以阅读论文原文,了解更多研究内容。

参考内容:https://www.nature.com/articles/d41586-025-02993-x

相关资讯

交大O1医疗探索:延长AI思考时间,解锁复杂推理诊断

编辑 | ScienceAI当医生面对复杂病例时,往往需要反复思考、权衡多种可能性,才能得出准确诊断。 以鉴别诊断为例,它要求医生生成可能的诊断列表,并通过评估临床发现,逐步排除不符合条件的选项。 如今,AI 也学会了这种「深思熟虑」的诊断方式。
1/15/2025 3:39:00 PM
ScienceAI

多中心医学图像分析模型,VFMGL框架破解数据孤岛难题,93.4% Dice系数的卓越表现

编辑丨&在众多中下游任务中,收到广泛而多样的数据集训练的基础模型表现出的强大性能,在医疗领域表现却不甚得人心。 受到到数据量、异质性和隐私问题等问题的严重阻碍,基础模型得不到更进一步的发展。 桂林航空航天大学联合江门市中心医院等推出了 Vision Foundation Model General Lightweight(VFMGL)框架,以促进各种医疗任务的专家临床模型的去中心化构建。
3/5/2025 5:48:00 PM
ScienceAI

精确捕捉疾病进程中细胞动力学变化,生成式平台UNAGI准确模拟药物扰动

编辑丨ScienceAI复杂疾病就像一场错综复杂的谜局:基因与环境因素在体内交织,导致细胞状态千变万化,也让我们难以看透病程背后的真相,进而影响了新药的研发。 虽然单细胞测序技术能为每个细胞「拍照留念」,现有的分析方式却往往只能看到零散的瞬间,无法还原疾病发展过程中细胞状态的连续变化。 更麻烦的是,现有的计算模型难以从这些数据中自动找出关键的基因调控网络,也无法精准锁定那些加剧病情的「元凶」基因和通路。
7/15/2025 2:17:00 PM
ScienceAI
  • 1