微软推出突破性医疗AI平台 MAI-DxO:大幅超越人类医生诊断精准度
发布时间:2025-07-02 10:38:16 | 责任编辑:吴昊 | 浏览量:17 次
微软首席执行官萨蒂亚·纳德拉近日在社交平台宣布,微软正式推出突破性医疗AI系统 MAI-DxO。这款创新系统以其独特的**“模型无关”设计**脱颖而出,能够灵活适配不同厂商和能力的语言模型,从而普遍提升其诊断性能。更令人振奋的是,MAI-DxO不仅能模拟真实医生的诊断流程,还在测试中展现出远超专业医生的诊断准确率,同时大幅降低了医疗诊断的成本。
微软公布的测试数据显示,在针对《新英格兰医学杂志》56例隐藏测试集的对比中,21名拥有十年以上经验的专业医生平均诊断准确率仅为19.9%。然而,MAI-DxO在无预算配置下使用OpenAI的o3模型时,准确率高达81.9%;在集成模式下更是达到了惊人的85.5%,这一表现是专业医生准确率的四倍以上。
MAI-DxO的核心创新在于其模拟了真实医疗团队的协作模式,通过一组具有不同角色的虚拟医生共同解决诊断问题,从而在诊断准确性和成本效益方面取得了显著突破。这支虚拟医生团队包括负责维护和更新鉴别诊断列表的Dr. Hypothesis;每轮选择最具区分度检查的Dr. Test-Chooser;充当监督员、识别偏差并提出挑战性建议的Dr. Challenger;倡导成本意识、优化检查方案的Dr. Stewardship;以及负责幕后质量控制、确保推理一致性的Dr. Checklist。
为了适应不同医疗场景对成本、效率和准确性的需求,MAI-DxO提供了五种集成模式。这些模式涵盖了从仅依赖初始病例摘要进行快速初步诊断的Instant Answer模式,适用于紧急或资源匮乏场景;到仅通过提问诊断、模拟初级诊疗的Question Only模式;引入动态预算控制机制的Budgeted模式;以最大化诊断准确性为目标、处理复杂疑难病例的No Budget模式;以及通过模拟多个医生团队并行工作,进一步提升诊断准确性的Ensemble模式。
伴随MAI-DxO的发布,微软还推出了一项专业的医疗序贯诊断基准SDBench。这个交互式评估框架将《新英格兰医学杂志》中304个具有挑战性的诊断案例转化为逐步诊断场景,为评估人类医生和AI的序贯诊断能力提供了真实素材。在SDBench中,“守门人”智能体模拟信息获取过程,而“法官”智能体则对诊断结果进行基于临床实质的多维度综合评估,同时将成本纳入评估指标,为医疗AI诊断树立了新的行业标准。
微软于2025年6月30日正式发布了名为 MAI-DxO(Microsoft AI Diagnostic Orchestrator) 的医疗AI系统。该系统在复杂病例的诊断测试中表现卓越,诊断准确率高达85.5%,远超经验丰富的医生。在与21名来自美国和英国、拥有超过10年从医经验的专业医生的测试对比中,人类医生的平均诊断准确率仅为19.9%。
系统特点
MAI-DxO的核心创新在于其模拟真实医生团队的协作模式,整合了多个领先的大型语言模型,如OpenAI的o3模型、Meta的Llama、Anthropic的Claude、Google的Gemini、xAI的Grok以及DeepSeek等。这些模型在MAI-DxO的协调下,形成了一个虚拟的医生团队,通过相互协作和“辩论”来制定诊疗方案。
该系统还具备以下特点:
-
模拟医生诊断流程:通过分析症状、提出针对性问题和推荐检查,逐步缩小诊断范围。
-
成本控制:在诊断过程中考虑检查成本,避免不必要的检查,降低整体医疗成本。
-
多种集成模式:提供五种集成模式,以适应不同的医疗场景和需求。
测试与结果
微软的研究团队基于《新英格兰医学杂志》记录的304个复杂病例创建了诊断性能基准。测试结果显示,MAI-DxO在无预算配置下使用OpenAI的o3模型时,诊断准确率高达81.9%,而在集成模式下,准确率进一步提升至85.5%。相比之下,人类医生在相同测试中的平均准确率仅为20%。
此外,MAI-DxO在成本方面也表现出色。人类医生在测试中平均每个案例的成本为2963美元,而MAI-DxO在预算内配置下的平均检查成本为2396美元。
未来展望
尽管MAI-DxO在复杂病例诊断中取得了显著的准确率和成本效益优势,但微软强调,AI工具并非旨在取代人类医生,而是作为辅助工具,帮助医生优化诊断流程、自动化常规任务,并创建个性化护理策略。
本网站(https://aigc.izzi.cn)刊载的所有内容,包括文字、图片、音频、视频等均在网上搜集。
访问者可将本网站提供的内容或服务用于个人学习、研究或欣赏,以及其他非商业性或非盈利性用途,但同时应遵守著作权法及其他相关法律的规定,不得侵犯本网站及相关权利人的合法权利。除此以外,将本网站任何内容或服务用于其他用途时,须征得本网站及相关权利人的书面许可,并支付报酬。
本网站内容原作者如不愿意在本网站刊登内容,请及时通知本站,予以删除。