新
国家/地区:美国🇺🇸
AI功能描述:旨在通过生成式世界基础模型(World Foundation Models,简称 WFMs)加速机器人和自动驾驶系统的训练与部署
AIGC官网收录 │
2025-05-21 │
8 次 │
人工核对 │
官网认证 │
定期更新 │
AI实验室
官网入口为官方网站入口;IOS为App Store下载渠道,支持iPad/iPhone/Mac;安卓为谷歌应用商店/腾讯应用宝下载渠道;客户端为官方下载渠道,支持Mac/Windows PC电脑端下载,iPad/iPhone/Android下载;插件为浏览器(默认“Chrome”)插件下载渠道;GitHub为模型/软件项目的GitHub托管平台;API为模型/软件的API接口;MCP为官网MCP栏目;以上无展示,则暂无对应渠道。欢迎广大网友,提供/纠错以上渠道。
NVIDIA Cosmos 视频介绍:
NVIDIA Cosmos 图文介绍:
NVIDIA Cosmos 是一款专为“物理人工智能”(Physical AI)开发的开放式平台,旨在通过生成式世界基础模型(World Foundation Models,简称 WFMs)加速机器人和自动驾驶系统的训练与部署。该平台结合了先进的数据处理、模型微调和合成数据生成能力,帮助开发者在虚拟环境中高效构建和测试 AI 系统,从而减少对真实世界测试的依赖。
核心功能与组件
1. Cosmos Predict
这是一款通用的多模态模型,能够根据文本、图像或视频提示生成虚拟世界状态,并预测连续动作或运动轨迹。其模型参数规模从 40 亿到 150 亿不等,适用于不同的推理需求。
2. Cosmos Reason
该模型具备链式思维推理能力,能够评估合成视觉内容并生成描述,加速数据策划过程。它还可以生成自然语言的动作建议,提升机器人在复杂环境中的决策能力。
3. Cosmos Transfer
这是一种条件世界生成模型,能够根据多种空间控制输入(如分割图、深度图、边缘图)生成世界模拟,实现高度可控的世界生成,适用于模拟到现实(Sim2Real)等多种应用场景。
技术优势
- 物理感知数据训练:Cosmos 的模型在超过 2000 万小时的机器人和驾驶数据上进行预训练,能够生成符合物理规律的世界状态。
- 高效数据处理:集成了 NVIDIA NeMo Curator,可在 NVIDIA Blackwell GPU 上高效处理大规模视频数据,显著缩短数据准备时间。
- 开放许可:Cosmos 的模型、守护机制和分词器均采用 NVIDIA 开放模型许可,允许开发者自由访问和定制。
应用场景
- 机器人训练:通过生成合成数据,帮助机器人在虚拟环境中学习复杂任务,提升其在现实世界中的表现。
- 自动驾驶系统:为自动驾驶车辆提供多样化的训练场景,增强其在不同环境下的感知和决策能力。
- 工业自动化:支持工业机器人在模拟环境中进行任务规划和执行,优化生产流程。
©️版权声明:
本网站(https://aigc.izzi.cn)刊载的所有内容,包括文字、图片、音频、视频等均在网上搜集。
访问者可将本网站提供的内容或服务用于个人学习、研究或欣赏,以及其他非商业性或非盈利性用途,但同时应遵守著作权法及其他相关法律的规定,不得侵犯本网站及相关权利人的合法权利。除此以外,将本网站任何内容或服务用于其他用途时,须征得本网站及相关权利人的书面许可,并支付报酬。
本网站内容原作者如不愿意在本网站刊登内容,请及时通知本站,予以删除。
本网站(https://aigc.izzi.cn)刊载的所有内容,包括文字、图片、音频、视频等均在网上搜集。
访问者可将本网站提供的内容或服务用于个人学习、研究或欣赏,以及其他非商业性或非盈利性用途,但同时应遵守著作权法及其他相关法律的规定,不得侵犯本网站及相关权利人的合法权利。除此以外,将本网站任何内容或服务用于其他用途时,须征得本网站及相关权利人的书面许可,并支付报酬。
本网站内容原作者如不愿意在本网站刊登内容,请及时通知本站,予以删除。
斯坦福大学CRFM致力于基础模型的研究,推动AI技术发展和伦理应用。