Prime Intellect 引发革新,发布“环境中心”开放平台,挑战AI强化学习的封闭格局
发布时间:2025-09-02 09:20:35 | 责任编辑:张毅 | 浏览量:23 次
位于旧金山的人工智能初创公司 Prime Intellect 正式发布“环境中心”(Environments Hub),这是一个用于构建和共享强化学习(RL)环境的开放平台,旨在对抗当前由大型人工智能实验室主导的封闭生态。
Prime Intellect 指出,交互式训练环境已成为下一阶段 AI 发展的关键瓶颈。在强化学习中,AI 代理通过与规则驱动的环境互动来学习,仅在面对动态变化时才能实现真正的智能。“如果没有环境交互,强化学习就只是数学。”公司如是表示。
近年来,多个大型实验室投入巨资开发专有 RL 环境,逐步将训练数据私有化。这种趋势正使得开源社区越来越难以训练出具备竞争力的 AI 模型。Prime Intellect 希望通过环境中心提供一个开放替代方案,避免被“围墙花园”所束缚。
Prime Intellect 计划将环境中心作为其下一代开源代理模型 INTELLECT-3 的数据引擎。该模型将基于来自社区贡献的 RL 环境数据进行训练,被定位为“完全开放、最先进的代理模型”。
为推动环境建设,Prime Intellect 发布了一系列现金奖励任务,寻找能评估代码质量、支持长时间运行任务、甚至能促进创意写作的强化学习环境。目标是降低开发门槛,让更多开发者能够参与先进 AI 模型的构建。
Prime Intellect 由 Vincent Weisser(曾活跃于 DeSci 去中心化科学领域)和 Johannes Hagemann(曾在 Aleph Alpha 领导大模型训练)联合创立。公司致力于去中心化 AI、共享算力资源,并在分布式系统中训练模型。
此前,Prime Intellect 已从 Founders Fund、Andrej Karpathy、以及 Hugging Face CEO Clem Delangue 等投资人处筹集了 2050万美元。今年早些时候,该公司曾推出去中心化模型 INTELLECT-2,作为其开源路线图的一部分
。
背景与动机
。Prime Intellect 认为,环境是强化学习的核心,它定义了 AI 智能体学习的“世界、规则和反馈闭环”(状态—动作—奖励)
。因此,开放平台 Environments Hub 的诞生,是为了让任何人都能创建、共享、复用高质量的 RL 环境,从而推动开源 AGI 的发展
。
核心功能
:
-
环境管理:通过 Hub 或 CLI 拉取、推送和管理 RL 环境。
-
评估与报告:为不同模型生成跨模型的评估报告。
-
原生支持:与 Prime Intellect 的
prime-rl
训练器深度集成,支持强化微调(RFT)。 -
安全沙箱:提供原生沙箱支持,可与 Verifier Environments 对接,实现安全的代码执行。
开源与社区驱动
。目前,已有 30 多位研究人员和公司参与了内测,并贡献了多种环境
。
未来展望
。
本网站(https://aigc.izzi.cn)刊载的所有内容,包括文字、图片、音频、视频等均在网上搜集。
访问者可将本网站提供的内容或服务用于个人学习、研究或欣赏,以及其他非商业性或非盈利性用途,但同时应遵守著作权法及其他相关法律的规定,不得侵犯本网站及相关权利人的合法权利。除此以外,将本网站任何内容或服务用于其他用途时,须征得本网站及相关权利人的书面许可,并支付报酬。
本网站内容原作者如不愿意在本网站刊登内容,请及时通知本站,予以删除。