首页 > 快讯 > MedGemma AI 模型由谷歌发布：一个革新医疗影像与文本解析的先进工具

MedGemma AI 模型由谷歌发布：一个革新医疗影像与文本解析的先进工具

发布时间：2025-05-21 15:31:09 | 责任编辑：吴昊 | 浏览量：140 次

在刚刚结束的2025年 I/O 开发者大会上，谷歌宣布开源全新医疗 AI 模型 ——MedGemma。这款基于 Gemma3架构的模型专为医疗领域设计，具备强大的多模态图像和文本理解能力，旨在提升医疗诊断与治疗效率。
MedGemma 提供两种配置选项，分别为4B 和27B 参数模型。4B 参数模型主要用于医疗图像的分类和解读，能够生成详细的诊断报告或回答与图像相关的问题;而27B 参数模型则专注于处理临床文本，特别适合于患者分诊和决策辅助。这意味着，医生可以更快地获得有关患者病情的有价值信息，从而更有效地制定治疗方案。
其中，4B 模型的图像编码器采用了 SigLIP 技术，预训练数据涵盖了胸部 X 光、皮肤病学、眼科及组织病理学等多个领域的图像，使得其在处理复杂医疗图像时表现出色。相比之下，27B 模型则以270亿参数为基础，专注于深度理解医疗文本，为临床推理提供支持，帮助医务人员更快速地进行决策。
更为灵活的是，开发者可以选择在本地运行这些模型进行实验，或者通过谷歌云的 Vertex AI 平台将其部署为 HTTPS 端点，方便进行大规模应用。谷歌还提供了 Colab 笔记本等丰富的资源，帮助开发者进行模型的微调和集成。
此外，谷歌鼓励开发者针对特定的使用场景对模型进行验证和微调，并提供了相关指导和工具，支持开发者在适配过程中使用提示工程、上下文学习及 LoRA 等方法进行高效的参数微调。这使得 MedGemma 不仅是一款先进的 AI 工具，更是开发者和医务人员在日常工作中提升效率的重要助手。
MedGemma 的推出标志着医疗 AI 领域的又一重大进展，为未来的医疗实践带来了无限可能。

MedGemma AI 模型由谷歌发布：一个革新医疗影像与文本解析的先进工具-项目/模型网址:
Hugging Face

谷歌在2025年5月的Google I/O大会上推出了MedGemma AI模型，这是一款用于医疗图像与文本分析的革命性工具。以下是关于MedGemma AI模型的详细介绍：

模型架构与版本

MedGemma 4B：这是一个40亿参数的多模态模型，能够同时处理医疗图像和文本。它使用了SigLIP图像编码器，该编码器在去标识化的医疗数据集上进行了预训练，包括胸部X光、皮肤科图像、眼科图像和组织病理学切片等。其语言模型部分则在多样化的医疗数据上进行了训练，以实现全面的理解。
MedGemma 27B：这是一个270亿参数的纯文本模型，专门针对需要深度医疗文本理解和临床推理的任务进行了优化。该模型仅通过指令微调，适用于需要高级文本分析的应用。

部署与访问

开发者可以通过Hugging Face访问MedGemma模型，但需要同意Health AI Developer Foundations的使用条款。这些模型可以在本地运行以进行实验，也可以通过Google Cloud的Vertex AI部署为可扩展的HTTPS端点，用于生产级应用。谷歌还提供了Colab笔记本等资源，以帮助开发者进行微调和集成到各种工作流程中。

应用场景

医疗图像分类：MedGemma 4B模型的预训练使其能够对各种医疗图像（如放射科扫描和皮肤科图像）进行分类。
医疗图像解读：该模型可以生成与医疗图像相关的报告或回答问题，辅助诊断过程。
临床文本分析：MedGemma 27B模型在理解、总结临床笔记方面表现出色，支持患者分诊和决策支持等任务。

适应性与微调

尽管MedGemma提供了强大的基线性能，但谷歌鼓励开发者针对其特定用例对模型进行验证和微调。开发者可以采用提示工程、上下文学习以及LoRA等参数高效微调方法来提升性能。谷歌还提供了相关指导和工具，以支持这些适应性调整过程。

总结

MedGemma作为一款开源的医疗AI开发工具，结合了多模态能力、可扩展性和适应性，为开发者提供了宝贵的资源。它有望推动医疗图像与文本分析的集成应用开发，为医疗领域的AI发展带来新的突破。

©️版权声明：
本网站(https://aigc.izzi.cn)刊载的所有内容，包括文字、图片、音频、视频等均在网上搜集。
访问者可将本网站提供的内容或服务用于个人学习、研究或欣赏，以及其他非商业性或非盈利性用途，但同时应遵守著作权法及其他相关法律的规定，不得侵犯本网站及相关权利人的合法权利。除此以外，将本网站任何内容或服务用于其他用途时，须征得本网站及相关权利人的书面许可，并支付报酬。
本网站内容原作者如不愿意在本网站刊登内容，请及时通知本站，予以删除。