首页 > 快讯 > Google 发布 TxGemma 开源模型，助力加速治疗性药物研发

Google 发布 TxGemma 开源模型，助力加速治疗性药物研发

发布时间：2025-03-31 14:08:06 | 责任编辑：字母汇 | 浏览量：153 次

《Google 发布 TxGemma 开源模型，助力加速治疗性药物研发》相关软件官网

近日，谷歌宣布推出全新开源模型 TxGemma，专为提升治疗性药物的研发效率而设计。这一模型由谷歌 DeepMind 团队基于其先进的 Gemma 模型家族微调开发，融合了强大的语言理解、科学预测以及多轮对话功能，旨在为药物研发领域带来革命性的突破。TxGemma 的发布被视为人工智能技术在生物医药领域的重要进展，有望大幅缩短药物从实验室到临床的周期，同时降低高昂的研发成本和失败率。
全流程支持药物研发
TxGemma 的核心优势在于其能够模拟药物研发的完整流程，从早期药物筛选到后期临床试验结果预测，覆盖多个关键环节。研究人员可以利用该模型进行药物分子的毒性预测、药物靶点识别以及疗效评估等任务。得益于其强大的计算能力，TxGemma 能够快速分析小分子化合物、化学物质和蛋白质等生物实体特性，帮助科学家更高效地筛选出潜在的候选药物，并预测其在临床试验中的表现。这种端到端的支持使得 TxGemma 成为药物研发中的“全能助手”，有望改变传统研发模式中耗时长、风险高的现状。
三种规模，灵活适配需求
为了满足不同研究场景和计算资源的需求，TxGemma 提供了三种模型规模:2B（20亿参数）、9B(90亿参数)和27B(270亿参数)。这些模型根据参数量的大小，适用于从轻量级任务到高复杂度研究的多种应用场景。每种规模的模型均包含“预测”(Predict)版本，专为特定任务优化，例如判断某一分子是否具有毒性或能否通过血脑屏障。此外，9B 和27B 规模的模型还推出了“聊天”(Chat)版本，不仅能执行预测任务，还能通过自然语言与研究人员进行多轮对话，解释预测背后的推理过程，并回答复杂的科学问题。这种对话能力为研究人员提供了一个互动性更强的工具，进一步提升了研发的灵活性和深度。
性能卓越，通用性突出
TxGemma 的性能表现尤为亮眼，尤其是其最大的27B 参数“预测”版本。据悉，该版本在几乎所有测试任务中都超越或匹敌了谷歌此前的通用模型 Tx-LLM，显示出极高的预测精度和稳定性。更令人瞩目的是，27B 模型甚至能与专为单一任务设计的专业模型相媲美，展现了其在多任务场景下的强大适应性。这种通用性不仅减少了研究人员对多种专用模型的依赖，还为跨领域药物研发提供了新的可能性。谷歌表示，TxGemma 的开发过程中使用了来自 Therapeutics Data Commons 的700万个训练样本，确保其在药物相关任务上的专业性和可靠性。
开源模式推动协作创新
作为一款开源模型，TxGemma 已通过谷歌的 Vertex AI 平台和 Hugging Face 向全球研究社区开放。谷歌强调，TxGemma 的设计初衷不仅在于提供强大的计算工具，更在于通过开放性激发全球科学家和开发者的协作创新。研究人员可以根据自身需求对模型进行微调，适配特定的治疗性药物开发场景。谷歌还同步发布了配套的 Colab 笔记本，展示如何将 TxGemma 集成到复杂的研究工作流中，进一步降低了使用门槛。
未来展望
药物研发一直是一个高风险、高投入的领域。据统计，90%的候选药物在第一阶段临床试验后即告失败，而成功研发一款新药往往需要数十亿美元和超过十年的时间。TxGemma 的出现为这一现状带来了新的希望。通过结合人工智能的预测能力和多轮对话功能，该模型不仅能加速药物筛选和优化过程，还能为研究人员提供更具洞察力的决策支持。业界专家认为，TxGemma 的开源发布可能推动药物研发进入一个更加高效和协作的新时代。
随着 TxGemma 的逐步应用，其在实际药物研发中的表现将成为关注的焦点。谷歌表示，未来将继续优化模型性能，并期待社区反馈以推动其进一步迭代。可以预见，随着人工智能与生物医药的深度融合，像 TxGemma 这样的工具将在拯救生命、改善人类健康的道路上发挥越来越重要的作用。
官方介绍：
https://developers.googleblog.com/en/introducing-txgemma-open-models-improving-therapeutics-development/

Google 发布 TxGemma 开源模型，助力加速治疗性药物研发

Google DeepMind 近期发布了 TxGemma，这是一组专为治疗性药物研发优化的开源大语言模型（LLM），旨在通过AI加速从药物发现到临床试验的全流程，降低研发成本并提高成功率。该模型基于轻量级开源模型 Gemma-2 微调而来，在多项生物医学任务上表现优于现有专业模型和通用AI系统。

1. TxGemma 的核心特点

（1）专为治疗开发优化的开源模型

基于 Gemma-2 微调：TxGemma 使用 700 万个治疗相关数据样本进行训练，涵盖小分子、蛋白质、核酸、疾病和细胞系等综合数据集。
三种参数规模：提供 2B、9B 和 27B 三种参数版本，适用于不同计算需求的研究场景。
多任务能力：支持分类（如毒性预测）、回归（如结合亲和力计算）、生成（如逆向合成分析）等任务。

（2）性能超越现有模型

在 Therapeutics Data Commons (TDC) 的 66 项治疗开发任务中，TxGemma 在 64 项上优于或接近通用模型（45 项显著领先），并在 50 项上超越专业模型（26 项显著领先）。
在 ChemBench 测试中，TxGemma 相比 o3-mini (high) 提升 5.6% (ChemBench-Preference) 和 1.1% (ChemBench-Mini)，相比 o1 提升 17.0% 和 4.3%。
在 Humanity’s Last Exam（化学与生物学推理基准）上，其配套的 Agentic-Tx 智能体比 o3-mini (high) 高 9.8%，比 o1 高 17.9%。

2. 关键应用：如何加速药物研发？

（1）预测药物属性

毒性预测：可判断分子是否可能穿过血脑屏障或引发不良反应。
结合亲和力计算：预测药物与靶标蛋白的结合强度，优化候选分子。
临床试验结果模拟：基于历史数据预测新药在人体试验中的潜在表现。

（2）交互式科学问答（TxGemma-Chat）

研究人员可用自然语言提问，如：

“为什么这个分子可能有毒？” → 模型基于结构特征给出解释。
“哪些基因可能影响该药物的代谢？” → 结合 PubMed 等外部知识库提供答案。

（3）智能体系统（Agentic-Tx）

18 种工具集成：包括 PubMed 搜索、分子结构分析、蛋白质相互作用预测等。
自动化工作流：例如，自动检索最新研究 → 分析潜在靶点 → 生成实验方案。

3. 行业影响与未来展望

降低 AI 在生物医药的门槛：开源模式让中小型实验室也能使用先进AI，无需依赖昂贵商业软件。
缩短药物研发周期：传统方法需 10-15 年，而 AI 辅助可能大幅压缩时间。
挑战与争议：
- 数据依赖性：高质量训练数据仍有限，可能影响模型泛化能力。
- 监管合规：AI 生成的药物候选仍需严格实验验证。

Google 同时提供了微调示例（Colab 笔记本），研究人员可基于自有数据优化模型，例如预测临床试验不良事件。

TxGemma 的发布标志着 AI+生物医药进入新阶段，未来或推动更多开源治疗模型生态的发展。

©️版权声明：
本网站(https://aigc.izzi.cn)刊载的所有内容，包括文字、图片、音频、视频等均在网上搜集。
访问者可将本网站提供的内容或服务用于个人学习、研究或欣赏，以及其他非商业性或非盈利性用途，但同时应遵守著作权法及其他相关法律的规定，不得侵犯本网站及相关权利人的合法权利。除此以外，将本网站任何内容或服务用于其他用途时，须征得本网站及相关权利人的书面许可，并支付报酬。
本网站内容原作者如不愿意在本网站刊登内容，请及时通知本站，予以删除。

上一篇：智谱发布Agent产品AutoGLM沉思：首个实现”边想边干”的智能体

下一篇： Wayve推完整世界模型GAIA-2：支持同时生成5个视角的视频，可模拟高风险场景

Google 发布 TxGemma 开源模型，助力加速治疗性药物研发

1. TxGemma 的核心特点

（1）专为治疗开发优化的开源模型

（2）性能超越现有模型

2. 关键应用：如何加速药物研发？

（1）预测药物属性

（2）交互式科学问答（TxGemma-Chat）

（3）智能体系统（Agentic-Tx）

3. 行业影响与未来展望

最新Ai信息

最新Ai工具

热门AI推荐