首页 > 快讯 > 医疗诊断精度飞跃四倍，得益于微软MAI-DxO AI系统的推出

医疗诊断精度飞跃四倍，得益于微软MAI-DxO AI系统的推出

发布时间：2025-07-01 15:13:56 | 责任编辑：张毅 | 浏览量：339 次

微软近日发布了一款全新的 AI 系统 MAI-DxO，旨在显著提升复杂医疗病例的诊断准确性。据悉，该系统的诊断准确率是经验丰富医生的四倍，同时能够将医疗成本降低近70%。这一技术通过一个新的基准测试进行评估，模拟了真实的逐步诊断过程。
研究团队在其论文《利用语言模型进行顺序诊断》中详细介绍了该系统，认为其在面对挑战性病例时，在准确性和成本效益方面显著优于人类医生。为了提供更真实的测试结果，团队创建了顺序诊断基准（SDBench）。与传统的医学 AI 测试不同，SDBench 并非一次性提供所有信息，而是模拟临床决策的顺序过程。
SDBench 的测试案例来源于《新英格兰医学杂志》的304个复杂病例。测试中，医生或 AI 诊断师首先获得一个简要的病例摘要，然后需主动请求更多信息，通过询问针对性的问题或要求检查来获取详细资料。该系统通过 “门控模型” 控制信息的发布，甚至可以生成某些检测的合成结果，以防止无意间泄露提示信息。
在测试中，来自美国和英国的21名经验丰富的医生的诊断准确率为19.9%，每个病例的平均费用为2963美元。相比之下，微软的 MAI-DxO 结合 OpenAI 的 o3模型，达到了79.9% 的准确率，且平均成本为2397美元。MAI-DxO 的主要进步在于成本的显著降低。尽管 o3模型在标准模型中达到78.6% 的最高准确率，但其平均费用高达7850美元。而通过 MAI-DxO 进行的诊断，准确率略有提升，成本却几乎降低了70%。
MAI-DxO 通过模拟一个虚拟的医生团队来提升性能。团队内部分别由 “假设医生”、“测试选择医生”、“质疑医生”、“成本监控医生” 和 “检查清单医生” 组成。这样的结构旨在防止系统过早固定于某一假设。
然而，研究人员也承认了一些限制因素。SDBench 仅基于复杂的教学案例，未能反映日常诊疗中常见病症的分布。成本计算只是粗略估算，未考虑现实世界中的多种因素。此外，参与的医生为全科医生，通常在面对复杂病例时会转介给专家，他们的评估也未利用外部资源。
划重点:
🔍 MAI-DxO 系统的诊断准确率是经验医生的四倍，成本降低近70%。
💡 SDBench 测试模拟真实的逐步诊断过程，通过动态请求信息提升准确性。
🩺 研究指出系统性能优越，但存在针对复杂病例的限制与挑战。

微软推出了一款名为“微软人工智能诊断协调器”（MAI-DxO）的医疗工具，该工具在诊断复杂疾病方面的成功率是人类医生的四倍。具体来说，MAI-DxO在测试中达到了85.5%的诊断成功率，而相比之下，经验丰富的人类医生在相同条件下的成功率约为20%。

MAI-DxO的工作原理

MAI-DxO的核心是一个“协调器”，它能够创建五个分工明确的智能体，组成虚拟专家组。这些智能体通过相互协作和“辩论”，共同制定诊疗方案。具体分工如下：

一个智能体负责提出假设；
一个智能体专门选择诊断测试；
一个智能体挑战假设，避免锚定偏见；
一个智能体负责成本意识的护理；
一个智能体确保质量控制。

测试与结果

为了验证其性能，研究人员让MAI-DxO学习了《新英格兰医学杂志》上发表的304份复杂病例研究。这些案例详细记录了医生解决难题的过程。测试采用了一种名为“辩论链”的新技术，能让人工智能推理模型逐步说明其的解决问题思路。结果显示，与OpenAI的o3推理模型配合使用时，MAI-DxO成功解决了85.5%的病例。

成本效益

除了提升诊断准确性，MAI-DxO还显著减少了正确诊断所需的检查项目。在某些情况下，这可以节省数十万美元。例如，在一个涉及酒精戒断和洗手液摄入的案例中，基线GPT-4模型订购了广泛的影像检查，包括脑部MRI和EEG，估计费用为3431美元，且诊断错误。而MAI-DxO早期识别出需要考虑院内毒素暴露，询问了洗手液消费情况，并通过针对性检查以795美元确认了诊断。

未来展望

微软计划将这项技术部署到其Copilot人工智能聊天机器人和必应搜索引擎中，这两个平台目前每天处理约5000万次健康咨询。微软人工智能首席执行官穆斯塔法·苏莱曼表示，微软正朝着实现远超人类表现的AI模型迈进。

©️版权声明：
本网站(https://aigc.izzi.cn)刊载的所有内容，包括文字、图片、音频、视频等均在网上搜集。
访问者可将本网站提供的内容或服务用于个人学习、研究或欣赏，以及其他非商业性或非盈利性用途，但同时应遵守著作权法及其他相关法律的规定，不得侵犯本网站及相关权利人的合法权利。除此以外，将本网站任何内容或服务用于其他用途时，须征得本网站及相关权利人的书面许可，并支付报酬。
本网站内容原作者如不愿意在本网站刊登内容，请及时通知本站，予以删除。