首页 > 快讯 > Google 发布 TxGemma 开源模型,助力加速治疗性药物研发

Google 发布 TxGemma 开源模型,助力加速治疗性药物研发

发布时间:2025-03-31 14:08:06 | 责任编辑:字母汇 | 浏览量:22 次

《Google 发布 TxGemma 开源模型,助力加速治疗性药物研发》相关软件

Google DeepMind Gemini Ai

近日,谷歌宣布推出全新开源模型 TxGemma,专为提升治疗性药物的研发效率而设计。这一模型由谷歌 DeepMind 团队基于其先进的 Gemma 模型家族微调开发,融合了强大的语言理解、科学预测以及多轮对话功能,旨在为药物研发领域带来革命性的突破。TxGemma 的发布被视为人工智能技术在生物医药领域的重要进展,有望大幅缩短药物从实验室到临床的周期,同时降低高昂的研发成本和失败率。
全流程支持药物研发
TxGemma 的核心优势在于其能够模拟药物研发的完整流程,从早期药物筛选到后期临床试验结果预测,覆盖多个关键环节。研究人员可以利用该模型进行药物分子的毒性预测、药物靶点识别以及疗效评估等任务。得益于其强大的计算能力,TxGemma 能够快速分析小分子化合物、化学物质和蛋白质等生物实体特性,帮助科学家更高效地筛选出潜在的候选药物,并预测其在临床试验中的表现。这种端到端的支持使得 TxGemma 成为药物研发中的“全能助手”,有望改变传统研发模式中耗时长、风险高的现状。
三种规模,灵活适配需求
为了满足不同研究场景和计算资源的需求,TxGemma 提供了三种模型规模:2B(20亿参数)、9B(90亿参数)和27B(270亿参数)。这些模型根据参数量的大小,适用于从轻量级任务到高复杂度研究的多种应用场景。每种规模的模型均包含“预测”(Predict)版本,专为特定任务优化,例如判断某一分子是否具有毒性或能否通过血脑屏障。此外,9B 和27B 规模的模型还推出了“聊天”(Chat)版本,不仅能执行预测任务,还能通过自然语言与研究人员进行多轮对话,解释预测背后的推理过程,并回答复杂的科学问题。这种对话能力为研究人员提供了一个互动性更强的工具,进一步提升了研发的灵活性和深度。
性能卓越,通用性突出
TxGemma 的性能表现尤为亮眼,尤其是其最大的27B 参数“预测”版本。据悉,该版本在几乎所有测试任务中都超越或匹敌了谷歌此前的通用模型 Tx-LLM,显示出极高的预测精度和稳定性。更令人瞩目的是,27B 模型甚至能与专为单一任务设计的专业模型相媲美,展现了其在多任务场景下的强大适应性。这种通用性不仅减少了研究人员对多种专用模型的依赖,还为跨领域药物研发提供了新的可能性。谷歌表示,TxGemma 的开发过程中使用了来自 Therapeutics Data Commons 的700万个训练样本,确保其在药物相关任务上的专业性和可靠性。
开源模式推动协作创新
作为一款开源模型,TxGemma 已通过谷歌的 Vertex AI 平台和 Hugging Face 向全球研究社区开放。谷歌强调,TxGemma 的设计初衷不仅在于提供强大的计算工具,更在于通过开放性激发全球科学家和开发者的协作创新。研究人员可以根据自身需求对模型进行微调,适配特定的治疗性药物开发场景。谷歌还同步发布了配套的 Colab 笔记本,展示如何将 TxGemma 集成到复杂的研究工作流中,进一步降低了使用门槛。
未来展望
药物研发一直是一个高风险、高投入的领域。据统计,90%的候选药物在第一阶段临床试验后即告失败,而成功研发一款新药往往需要数十亿美元和超过十年的时间。TxGemma 的出现为这一现状带来了新的希望。通过结合人工智能的预测能力和多轮对话功能,该模型不仅能加速药物筛选和优化过程,还能为研究人员提供更具洞察力的决策支持。业界专家认为,TxGemma 的开源发布可能推动药物研发进入一个更加高效和协作的新时代。
随着 TxGemma 的逐步应用,其在实际药物研发中的表现将成为关注的焦点。谷歌表示,未来将继续优化模型性能,并期待社区反馈以推动其进一步迭代。可以预见,随着人工智能与生物医药的深度融合,像 TxGemma 这样的工具将在拯救生命、改善人类健康的道路上发挥越来越重要的作用。
官方介绍:
https://developers.googleblog.com/en/introducing-txgemma-open-models-improving-therapeutics-development/

Google 发布 TxGemma 开源模型,助力加速治疗性药物研发

Google DeepMind 近期发布了 TxGemma,这是一组专为治疗性药物研发优化的开源大语言模型(LLM),旨在通过AI加速从药物发现到临床试验的全流程,降低研发成本并提高成功率。该模型基于轻量级开源模型 Gemma-2 微调而来,在多项生物医学任务上表现优于现有专业模型和通用AI系统。

1. TxGemma 的核心特点

(1)专为治疗开发优化的开源模型

  • 基于 Gemma-2 微调:TxGemma 使用 700 万 个治疗相关数据样本进行训练,涵盖小分子、蛋白质、核酸、疾病和细胞系等综合数据集。
  • 三种参数规模:提供 2B、9B 和 27B 三种参数版本,适用于不同计算需求的研究场景。
  • 多任务能力:支持分类(如毒性预测)、回归(如结合亲和力计算)、生成(如逆向合成分析)等任务。

(2)性能超越现有模型

  • 在 Therapeutics Data Commons (TDC) 的 66 项治疗开发任务中,TxGemma 在 64 项 上优于或接近通用模型(45 项显著领先),并在 50 项 上超越专业模型(26 项显著领先)。
  • 在 ChemBench 测试中,TxGemma 相比 o3-mini (high) 提升 5.6% (ChemBench-Preference) 和 1.1% (ChemBench-Mini),相比 o1 提升 17.0% 和 4.3%。
  • 在 Humanity’s Last Exam(化学与生物学推理基准)上,其配套的 Agentic-Tx 智能体比 o3-mini (high) 高 9.8%,比 o1 高 17.9%。

2. 关键应用:如何加速药物研发?

(1)预测药物属性

  • 毒性预测:可判断分子是否可能穿过血脑屏障或引发不良反应。
  • 结合亲和力计算:预测药物与靶标蛋白的结合强度,优化候选分子。
  • 临床试验结果模拟:基于历史数据预测新药在人体试验中的潜在表现。

(2)交互式科学问答(TxGemma-Chat)

研究人员可用自然语言提问,如:

  • “为什么这个分子可能有毒?” → 模型基于结构特征给出解释。
  • “哪些基因可能影响该药物的代谢?” → 结合 PubMed 等外部知识库提供答案。

(3)智能体系统(Agentic-Tx)

  • 18 种工具集成:包括 PubMed 搜索、分子结构分析、蛋白质相互作用预测 等。
  • 自动化工作流:例如,自动检索最新研究 → 分析潜在靶点 → 生成实验方案。

3. 行业影响与未来展望

  • 降低 AI 在生物医药的门槛:开源模式让中小型实验室也能使用先进AI,无需依赖昂贵商业软件。
  • 缩短药物研发周期:传统方法需 10-15 年,而 AI 辅助可能大幅压缩时间。
  • 挑战与争议:
    • 数据依赖性:高质量训练数据仍有限,可能影响模型泛化能力。
    • 监管合规:AI 生成的药物候选仍需严格实验验证。

Google 同时提供了 微调示例(Colab 笔记本),研究人员可基于自有数据优化模型,例如预测临床试验不良事件。

TxGemma 的发布标志着 AI+生物医药 进入新阶段,未来或推动更多开源治疗模型生态的发展。

最新Ai信息

最新Ai工具