首页 > 快讯 > Prime Intellect 引发革新，发布“环境中心”开放平台，挑战AI强化学习的封闭格局

Prime Intellect 引发革新，发布“环境中心”开放平台，挑战AI强化学习的封闭格局

发布时间：2025-09-02 09:20:35 | 责任编辑：张毅 | 浏览量：23 次

位于旧金山的人工智能初创公司 Prime Intellect 正式发布“环境中心”（Environments Hub），这是一个用于构建和共享强化学习（RL)环境的开放平台，旨在对抗当前由大型人工智能实验室主导的封闭生态。
Prime Intellect 指出，交互式训练环境已成为下一阶段 AI 发展的关键瓶颈。在强化学习中，AI 代理通过与规则驱动的环境互动来学习，仅在面对动态变化时才能实现真正的智能。“如果没有环境交互，强化学习就只是数学。”公司如是表示。
近年来，多个大型实验室投入巨资开发专有 RL 环境，逐步将训练数据私有化。这种趋势正使得开源社区越来越难以训练出具备竞争力的 AI 模型。Prime Intellect 希望通过环境中心提供一个开放替代方案，避免被“围墙花园”所束缚。
Prime Intellect 计划将环境中心作为其下一代开源代理模型 INTELLECT-3 的数据引擎。该模型将基于来自社区贡献的 RL 环境数据进行训练，被定位为“完全开放、最先进的代理模型”。
为推动环境建设，Prime Intellect 发布了一系列现金奖励任务，寻找能评估代码质量、支持长时间运行任务、甚至能促进创意写作的强化学习环境。目标是降低开发门槛，让更多开发者能够参与先进 AI 模型的构建。
Prime Intellect 由 Vincent Weisser（曾活跃于 DeSci 去中心化科学领域）和 Johannes Hagemann（曾在 Aleph Alpha 领导大模型训练）联合创立。公司致力于去中心化 AI、共享算力资源，并在分布式系统中训练模型。
此前，Prime Intellect 已从 Founders Fund、Andrej Karpathy、以及 Hugging Face CEO Clem Delangue 等投资人处筹集了 2050万美元。今年早些时候，该公司曾推出去中心化模型 INTELLECT-2，作为其开源路线图的一部分

Prime Intellect 正式推出名为 “Environments Hub” 的开放平台，旨在打破当前强化学习（RL）环境中“封闭、割裂、难以共享”的趋势，为开源 AGI 构建基础设施

。

背景与动机

传统强化学习环境往往由初创公司构建并出售给少数封闭的大型实验室，形成了“高墙花园”（walled garden），导致开源模型在竞争中逐渐落后

。Prime Intellect 认为，环境是强化学习的核心，它定义了 AI 智能体学习的“世界、规则和反馈闭环”（状态—动作—奖励）

。因此，开放平台 Environments Hub 的诞生，是为了让任何人都能创建、共享、复用高质量的 RL 环境，从而推动开源 AGI 的发展

。

核心功能

Environments Hub 提供了以下关键功能

：

环境管理：通过 Hub 或 CLI 拉取、推送和管理 RL 环境。
评估与报告：为不同模型生成跨模型的评估报告。
原生支持：与 Prime Intellect 的 prime-rl 训练器深度集成，支持强化微调（RFT）。
安全沙箱：提供原生沙箱支持，可与 Verifier Environments 对接，实现安全的代码执行。

开源与社区驱动

Environments Hub 是一个完全开源、社区驱动的平台。Prime Intellect 鼓励研究人员和初创公司贡献环境、评估任务和代码，共同构建一个开放、共享、可扩展的 RL 生态系统

。目前，已有 30 多位研究人员和公司参与了内测，并贡献了多种环境

。

未来展望

Prime Intellect 计划将 Environments Hub 作为其全栈式开源 AGI 基础设施的一部分，支持全球计算资源的无缝运行，降低大规模训练和部署模型的成本与门槛，最终推动 AI 原生产品的创新

。

©️版权声明：
本网站(https://aigc.izzi.cn)刊载的所有内容，包括文字、图片、音频、视频等均在网上搜集。
访问者可将本网站提供的内容或服务用于个人学习、研究或欣赏，以及其他非商业性或非盈利性用途，但同时应遵守著作权法及其他相关法律的规定，不得侵犯本网站及相关权利人的合法权利。除此以外，将本网站任何内容或服务用于其他用途时，须征得本网站及相关权利人的书面许可，并支付报酬。
本网站内容原作者如不愿意在本网站刊登内容，请及时通知本站，予以删除。