AI在线 AI在线

微软推出 MAI-DxO AI 系统,医疗诊断准确率提升四倍

微软近日发布了一款全新的 AI 系统 MAI-DxO,旨在显著提升复杂医疗病例的诊断准确性。 据悉,该系统的诊断准确率是经验丰富医生的四倍,同时能够将医疗成本降低近70%。 这一技术通过一个新的基准测试进行评估,模拟了真实的逐步诊断过程。

微软近日发布了一款全新的 AI 系统 MAI-DxO,旨在显著提升复杂医疗病例的诊断准确性。据悉,该系统的诊断准确率是经验丰富医生的四倍,同时能够将医疗成本降低近70%。这一技术通过一个新的基准测试进行评估,模拟了真实的逐步诊断过程。

image.png

研究团队在其论文《利用语言模型进行顺序诊断》中详细介绍了该系统,认为其在面对挑战性病例时,在准确性和成本效益方面显著优于人类医生。为了提供更真实的测试结果,团队创建了顺序诊断基准(SDBench)。与传统的医学 AI 测试不同,SDBench 并非一次性提供所有信息,而是模拟临床决策的顺序过程。

SDBench 的测试案例来源于《新英格兰医学杂志》的304个复杂病例。测试中,医生或 AI 诊断师首先获得一个简要的病例摘要,然后需主动请求更多信息,通过询问针对性的问题或要求检查来获取详细资料。该系统通过 “门控模型” 控制信息的发布,甚至可以生成某些检测的合成结果,以防止无意间泄露提示信息。

image.png

在测试中,来自美国和英国的21名经验丰富的医生的诊断准确率为19.9%,每个病例的平均费用为2963美元。相比之下,微软的 MAI-DxO 结合 OpenAI 的 o3模型,达到了79.9% 的准确率,且平均成本为2397美元。MAI-DxO 的主要进步在于成本的显著降低。尽管 o3模型在标准模型中达到78.6% 的最高准确率,但其平均费用高达7850美元。而通过 MAI-DxO 进行的诊断,准确率略有提升,成本却几乎降低了70%。

MAI-DxO 通过模拟一个虚拟的医生团队来提升性能。团队内部分别由 “假设医生”、“测试选择医生”、“质疑医生”、“成本监控医生” 和 “检查清单医生” 组成。这样的结构旨在防止系统过早固定于某一假设。

然而,研究人员也承认了一些限制因素。SDBench 仅基于复杂的教学案例,未能反映日常诊疗中常见病症的分布。成本计算只是粗略估算,未考虑现实世界中的多种因素。此外,参与的医生为全科医生,通常在面对复杂病例时会转介给专家,他们的评估也未利用外部资源。

划重点:

🔍 MAI-DxO 系统的诊断准确率是经验医生的四倍,成本降低近70%。  

💡 SDBench 测试模拟真实的逐步诊断过程,通过动态请求信息提升准确性。  

🩺 研究指出系统性能优越,但存在针对复杂病例的限制与挑战。

相关资讯

报道称​微软启动AI新战略 自主研 MAI模型以挑战OpenAI

媒体报道称,自微软内部 AI 部门负责人 Mustafa Suleyman 接手微软的 AI 业务以来,该公司的合作伙伴 OpenAI 关系经历了波动。 据知情人士透露,在去年的一次视频会议上,Suleyman 与 OpenAI 管理层就 “思维链” 推理过程的不同看法发生了争执,最终导致会议提前结束。 为了减少对 OpenAI 的依赖,Suleyman 组建了一支专注于开发自主 AI 模型 MAI 的研究团队。
3/8/2025 10:00:37 AM
AI在线

微软全新开源模型 MAI-DS-R1:敏感话题响应提升,安全风险降低

微软在其官网上正式开源了 DeepSeek-R1的魔改版 ——MAI-DS-R1。 这一新模型在保留原有推理性能的基础上,进行了显著的增强,尤其在对敏感话题的响应能力上取得了巨大的突破。 MAI-DS-R1的响应能力达到了99.3%,是原版 R1的两倍多。
4/18/2025 5:00:40 PM
AI在线

消息称微软将推出自研新 AI 模型“MAI-1”,与谷歌、OpenAI 竞争

据 The Information 北京时间今晚报道,微软正在公司内部训练一个新的人工智能模型,其规模足以与谷歌、Anthropic,乃至 OpenAI 自身的先进模型相抗衡。报道称,这个新模型内部代号为“MAI-1”,由前谷歌 AI 领导人 Mustafa Suleyman 带队负责。在 Mustafa 进入微软之前,他曾担任初创公司 Inflection 的 CEO,直到今年 3 月微软支付 6.5 亿美元(IT之家备注:当前约 46.87 亿元人民币)购买该公司产权并雇佣大部分员工。图源 Pixabay微软的
5/6/2024 10:55:02 PM
清源
  • 1