首页 > 快讯 > 迎接清晰视野！英伟达推出ViPE引擎，为AI空间提供精确3D信息

迎接清晰视野！英伟达推出ViPE引擎，为AI空间提供精确3D信息

发布时间：2025-09-16 14:17:34 | 责任编辑：吴昊 | 浏览量：228 次

近日，英伟达与多伦多大学、向量研究所及德克萨斯大学奥斯汀分校的研究团队联合发布了一项名为 **ViPE（视频姿势引擎）**的突破性技术。ViPE 旨在解决3D几何感知领域的关键挑战，即如何从复杂的自然视频中高效且精准地提取3D信息。
3D几何感知是自动驾驶、虚拟现实（VR）和增强现实(AR)等多种现代技术的核心。ViPE 创新性地从原始视频中快速获取相机的固有特性、运动信息以及高精度的深度图，为这些空间AI系统提供了可靠的数据基础。
ViPE 具有强大的适应性，能够处理各种场景和相机类型，包括动态自拍视频、电影镜头、行车记录仪以及针孔、广角和360°全景相机模型。
研究团队采用了一种多重约束的混合方法来确保 ViPE 的高精度:
束调整:在关键帧上进行密集束调整，以估算相机参数、姿态和深度图。
密集流与稀疏点约束:引入 DROID-SLAM 网络的密集流约束和 cuvslam 库的稀疏点约束，确保稳健性和亚像素精度。
深度正则化:利用单目度量深度网络，解决尺度模糊性和一致性问题，生成高分辨率且时间一致的深度信息。
测试结果显示，ViPE 在多个基准测试中的表现均优于现有技术（如 MegaSAM、VGGT 和 MASt3R-SLAM）。它不仅在姿态和内在函数精度方面表现出色，还能在单个GPU上以每秒3到5帧的速度稳定运行，并成功生成了尺度一致的轨迹。
为推动空间AI领域的进一步研究，该团队还发布了一个包含约9600万帧标注数据的大规模数据集，为未来的技术探索提供了宝贵资源。ViPE的发布不仅标志着3D几何感知技术的一次重要进步，也为未来的空间AI应用奠定了坚实的基础。
地址：https://research.nvidia.com/labs/toronto-ai/vipe/

这是一篇关于告别模糊!英伟达发布ViPE引擎为空间AI提供高精度3D数据的文章，内容值得关注。

©️版权声明：
本网站(https://aigc.izzi.cn)刊载的所有内容，包括文字、图片、音频、视频等均在网上搜集。
访问者可将本网站提供的内容或服务用于个人学习、研究或欣赏，以及其他非商业性或非盈利性用途，但同时应遵守著作权法及其他相关法律的规定，不得侵犯本网站及相关权利人的合法权利。除此以外，将本网站任何内容或服务用于其他用途时，须征得本网站及相关权利人的书面许可，并支付报酬。
本网站内容原作者如不愿意在本网站刊登内容，请及时通知本站，予以删除。

上一篇：英国新数据中心将由谷歌运营，预期年排放57万吨二氧化碳

下一篇： Eightco Holdings 现称 ORBS，致力于 AI 及人类身份验证领域

迎接清晰视野！英伟达推出ViPE引擎，为AI空间提供精确3D信息

最新Ai信息

最新Ai工具

热门AI推荐