Agentica 官网

官网入口

国家/地区：美国🇺🇸

AI功能描述：推动了强化学习在大语言模型中的应用，为研究人员和开发者提供了一个强大的平台。

说明: 官网入口 官方网站主页； IOS App Store 下载，支持 iPhone/iPad/Mac；安卓 Google Play / 应用宝下载； 客户端 Mac/Windows/iOS/Android 官方下载；插件浏览器插件（默认 Chrome）； GitHub / HuggingFace / ModelScope 模型或项目托管地址； API 模型/软件接口地址； MCP 官网的 MCP 栏目入口。若未显示，表示暂无对应渠道，欢迎补充或纠错。

AIGC官网收录 │ 2025-04-09 │ 249 次 │ 人工核对 │ 官网认证 │ 定期更新 │ AI智能体

Agentica 图文介绍：

Agentica 是一个专注于强化学习（Reinforcement Learning, RL）和大语言模型（LLMs）的开源项目，旨在通过分布式强化学习（Distributed RL）技术，推动 LLMs 的发展并实现更高效的模型训练和优化。以下是其主要介绍和特点：

项目背景

Agentica 项目的核心目标是通过开源的方式，让强化学习技术更加普及，特别是在大语言模型（LLMs）的应用中。该项目致力于复现 DeepSeek R1 和 OpenAI O1/O3 等先进模型，并在真实任务中进行大规模应用。

DeepScaleR 项目

Agentica 项目中的一个重要成果是 DeepScaleR，这是一个基于分布式强化学习（RL）的开源项目，旨在通过扩展 RL 技术来优化 LLMs。

DeepScaleR-1.5B-Preview

模型介绍：DeepScaleR-1.5B-Preview 是一个基于 Deepseek-R1-Distilled-Qwen-1.5B 的语言模型，通过分布式强化学习（RL）进行微调。
性能表现：该模型在 AIME 2024 测试中取得了 43.1% 的 Pass@1 准确率，超越了 OpenAI 的 o1-preview 模型（仅使用 1.5B 参数）。
开源意义：通过开源的方式，DeepScaleR 项目为研究人员和开发者提供了一个强大的工具，帮助他们在 LLMs 上实现更高效的训练和优化。

项目特点

开源性：Agentica 项目完全开源，鼓励社区参与和贡献，推动技术的快速发展。
分布式强化学习：利用分布式强化学习技术，DeepScaleR 能够在大规模数据和复杂任务上实现高效的模型训练。
高性能：通过优化训练过程，DeepScaleR 在多项基准测试中表现出色，超越了现有的先进模型。
社区驱动：Agentica 项目由 Michael Luo、Sijun Tan、Tianjun Zhang 等研究人员和开发者共同推动，形成了一个活跃的社区。

联系方式

Agentica 项目提供了多种联系方式，方便用户和开发者进行交流和合作：

电子邮件：通过电子邮件与项目团队联系。
GitHub：在 GitHub 上查看项目代码和参与开发。
X 社交平台：通过 X 社交平台关注项目动态。
Hugging Face：在 Hugging Face 上获取更多模型和工具。

项目意义

Agentica 项目通过开源的方式，推动了强化学习在大语言模型中的应用，为研究人员和开发者提供了一个强大的平台。DeepScaleR 项目的成功展示了分布式强化学习在优化 LLMs 方面的巨大潜力，为未来的人工智能研究和应用提供了新的方向。

©️版权声明：
本网站(AIGC官网)刊载的所有内容，包括文字、图片、音频、视频等均在网上搜集。
访问者可将本网站提供的内容或服务用于个人学习、研究或欣赏，以及其他非商业性或非盈利性用途，但同时应遵守著作权法及其他相关法律的规定，不得侵犯本网站及相关权利人的合法权利。除此以外，将本网站任何内容或服务用于其他用途时，须征得本网站及相关权利人的书面许可，并支付报酬。
本网站内容原作者如不愿意在本网站刊登内容，请及时通知本站，予以删除。