夸克推出健康大模型技术报告,详细公开AI“主任医师”技术内容
发布时间:2025-08-25 14:49:55 | 责任编辑:吴昊 | 浏览量:12 次
近日,夸克正式发布健康大模型技术报告《QuarkMed Technical Report》,首次公开了“主任医师级”能力的技术实现细节。
QuarkMed Technical Report
此前,夸克健康大模型成功通过了中国12门核心学科的主任医师笔试评测,成为国内首个完成这一挑战的大模型。在与通用模型对比中,夸克健康大模型呈现出“难度越高、领先优势越明显”的性能曲线,尤其是在复杂医学推理任务中实现突破。本次技术报告系统披露了这一突破背后的关键路径与技术亮点。
面对医疗模型需要高质量、高专业度训练数据的问题,夸克健康大模型在模型训练不同阶段,使用了三类核心医疗数据:医学资料、医学知识和医疗记录,数据总量高达约1万亿Token。这些专业数据能有效弥补预训练语料库的不足,有助于提高模型的准确性与推理能力。
医疗数据源分类及规模
为提升模型正确性、安全性以及复杂推理能力,夸克健康大模型引入两个强化学习(RL)阶段。第一阶段通过大规模医学强化学习,提升大模型在复杂场景中的推理能力。第二阶段通过设计奖励模型,从诚实性、有用性、内容合规性三个角度评估模型输出质量、调整模型行为,使其符合人类偏好和价值观。
训练期间,针对一般任务和推理任务使用三种类型的奖励信号
技术报告同时还公布了多个性能测试结果。在MedQA等多个国际权威数据集测试中,夸克健康大模型相比o3-mini等同尺寸模型表现出了更优异的性能。在中国医师资格考试(CPQExam)笔试评测中,笔试难度越高,夸克健康大模型领先优势越明显。
CPQExam测试结果
报告中透露,夸克计划将医师考试测试集全面公开,以促进医学相关的AI研究。
附访问与下载地址:
https://arxiv.org/pdf/2508.11894
https://github.com/Quark-Medical/QuarkMed/blob/main/report/QuarkMed_Technical_Report.pdf
。
一、技术突破与评测成绩
-
国内首个通过主任医师评测的大模型:夸克健康大模型成功通过中国12门核心学科的主任医师笔试评测,涵盖普通内科、外科、妇产科、儿科、肿瘤科等
。
-
高难度任务表现突出:在复杂医疗推理任务中,夸克健康大模型正确率达67.7%,远超通用模型DeepSeek-R1(38.7%)和GPT-o3-mini(35.5%),且任务难度越高,优势越明显
。
二、核心技术架构与训练策略
:
技术维度 | 具体实现 |
---|---|
知识构建 |
使用高质量医学数据对底座模型进行继续训练,确保知识覆盖全面且准确
。 |
正确性对齐 |
引入“循证医学”原则,系统解决模型输出的正确性问题,降低错误风险
。 |
慢思考能力 |
通过强化学习构建推理大模型,驱动模型在面对复杂医疗问题时,分阶段、层层深入推导答案
。 |
数据策略 | 构建了“双数据产线+双奖励机制”: |
训练方法 |
采用GRPO强化学习算法,通过多组采样及综合奖励计算策略优势,优化模型参数,提升推理链条的清晰度和医学逻辑一致性
。 |
三、风险控制与产品应用
-
全链路风险控制:
-
事前:通过底层算法和数据预防,确保产品满意度与准确率达标后上线;
-
事中:模型对敏感或不确定问题拒答,产品设计兜底话术、增加溯源引用,机器与人工抽查结合;
-
事后:根据用户反馈,持续迭代优化模型
。
-
-
产品落地:目前,“主任级AI医生”能力已全面集成至夸克AI搜索,用户查询健康问题时,选择“深度搜索”即可调用
。
四、未来规划
。
此次技术报告的发布,不仅展示了夸克在健康垂类大模型领域的技术深度与工程化能力,也为AI在严肃医疗场景的应用提供了可复用的技术路径和实践范本。
本网站(https://aigc.izzi.cn)刊载的所有内容,包括文字、图片、音频、视频等均在网上搜集。
访问者可将本网站提供的内容或服务用于个人学习、研究或欣赏,以及其他非商业性或非盈利性用途,但同时应遵守著作权法及其他相关法律的规定,不得侵犯本网站及相关权利人的合法权利。除此以外,将本网站任何内容或服务用于其他用途时,须征得本网站及相关权利人的书面许可,并支付报酬。
本网站内容原作者如不愿意在本网站刊登内容,请及时通知本站,予以删除。