首页 > 快讯 > 谷歌揭幕三大创新Gemma模型版本，开辟AI在医疗、手语和海豚交流领域的新机遇！

谷歌揭幕三大创新Gemma模型版本，开辟AI在医疗、手语和海豚交流领域的新机遇！

发布时间：2025-05-26 09:26:01 | 责任编辑：吴昊 | 浏览量：254 次

近日，谷歌在人工智能领域再掀波澜，宣布推出基于Gemma模型的三款全新变体:MedGemma、SignGemma和DolphinGemma。这些模型分别针对医疗、手语翻译和海豚语言研究领域，展现了AI技术在跨领域应用的巨大潜力。以下，小编为您详细解读这三款模型的亮点与应用前景。
MedGemma:革新医疗AI，助力精准诊疗
MedGemma是谷歌专为医疗领域打造的AI模型，提供两个版本以满足不同需求。4B多模态模型能够处理图像与文本的组合任务，经过针对胸部X光片、皮肤科图像、眼科图像和病理切片等医疗数据的预训练，展现了在医疗影像诊断、报告生成和患者分诊等任务中的强大能力。27B文字推理模型则专注于纯文本处理，凭借更强的推理能力，适用于病历分析、医疗问答等需要深入理解的场景。这两款模型均可在单块GPU上高效运行，为医疗开发者提供了灵活的开发选择。
谷歌表示，MedGemma通过其Health AI Developer Foundations计划发布，旨在加速医疗应用的开发。未来，开发者可利用这些模型构建更智能的医疗工具，为精准医疗注入新动能。
SignGemma:打破沟通壁垒，手语翻译更进一步
SignGemma是一款专为手语翻译设计的开放模型，重点支持美国手语（ASL）到英语的翻译。这款模型能够将手语动作转化为口语文本，为聾病患者和开发者提供了全新的交互方式。据悉，SignGemma在手语理解方面表现卓越，被誉为“迄今为止最强大的手语理解模型”。
谷歌计划在未来进一步扩展SignGemma的多语言支持，助力全球聾病社区实现无障碍沟通。开发者可基于此模型开发创新应用，例如实时手语翻译工具或教育平台，为聾病群体带来更多便利。
DolphinGemma:解码海豚语言，探索跨物种沟通
DolphinGemma是谷歌与Wild Dolphin Project（WDP）和乔治亚理工学院合作开发的创新模型，旨在分析和生成海豚的复杂声音。这款模型基于40年积累的北大西洋斑点海豚声学数据，能够识别签名哨声、脉冲爆裂声等特定声音模式，并预测声音序列，类似于人类语言模型的预测机制。
DolphinGemma已集成到WDP的CHAT（Cetacean Hearing Augmentation Telemetry）系统中，通过智能手机界面实现实时海豚声音分析。研究人员甚至尝试通过合成哨声与海豚进行简单交互，例如请求海豚与特定物体互动。谷歌计划于2025年夏季将DolphinGemma开源，允许更多研究者将其应用于其他鲸类物种，加速跨物种沟通的研究进程。
开源与未来:AI赋能跨领域创新
谷歌强调，这三款模型均基于Gemma架构，兼顾高效性和适应性。MedGemma现已通过Health AI Developer Foundations计划开放使用，SignGemma和DolphinGemma也将在未来陆续开源。然而，Gemma系列的非标准许可条款也引发了一些开发者对商业应用的担忧，未来谷歌可能需要进一步优化许可政策以提升模型的商业化潜力。
技术与社会价值的双赢
从医疗诊断到手语翻译，再到海豚语言研究，谷歌的三大Gemma模型变体展现了AI技术在解决实际问题和探索未知领域的无限可能。MedGemma为医疗行业带来了高效工具，SignGemma推动了无障碍沟通，而DolphinGemma则为人类与自然界的对话打开了新窗口。小编认为，这些创新不仅体现了技术的前瞻性，也彰显了AI在社会价值与科学研究中的重要作用。

谷歌在2025年Google I/O开发者大会上重磅发布了基于Gemma模型的三大变体：MedGemma、SignGemma和DolphinGemma，分别在AI医疗、手语翻译和海豚语言研究领域带来了新的突破。

MedGemma：医疗领域的多模态AI模型

MedGemma是专为医疗场景设计的多模态AI模型，能够处理医学文本和图像。它基于Gemma 3开发，具有出色的多模态分析能力，能够帮助开发者构建更精确的医疗图像识别和病历文本处理工具。该模型体积小、推理效率高，且开源设计允许开发者灵活微调，适用于隐私敏感的医疗场景。

SignGemma：手语翻译的AI模型

SignGemma是一款专注于手语识别的AI模型，能够将美国手语（ASL）翻译成英语文本。谷歌称其为“迄今为止最强大的手语理解模型”，旨在帮助开发者为听障用户构建更友好的沟通工具。该模型的推出有望显著改善听障人士的沟通体验。

DolphinGemma：海豚语言研究的AI模型

DolphinGemma是全球首个专为海豚设计的大语言模型。谷歌与佐治亚理工学院和野生海豚项目合作，利用数十年的野外研究数据对模型进行微调。该模型能够识别海豚的声音模式并预测其后续发声，未来有望实现人类与海豚的双向交流。

这三大模型变体的推出，展示了谷歌在AI领域的强大实力和创新能力，也为医疗、无障碍沟通和跨物种交流带来了新的可能性。

©️版权声明：
本网站(https://aigc.izzi.cn)刊载的所有内容，包括文字、图片、音频、视频等均在网上搜集。
访问者可将本网站提供的内容或服务用于个人学习、研究或欣赏，以及其他非商业性或非盈利性用途，但同时应遵守著作权法及其他相关法律的规定，不得侵犯本网站及相关权利人的合法权利。除此以外，将本网站任何内容或服务用于其他用途时，须征得本网站及相关权利人的书面许可，并支付报酬。
本网站内容原作者如不愿意在本网站刊登内容，请及时通知本站，予以删除。