首页 > 快讯 > 蚂蚁灵波科技发布开源项目 LingBot-Map:实现实时三维重建的单摄像头流式处理

蚂蚁灵波科技发布开源项目 LingBot-Map:实现实时三维重建的单摄像头流式处理

发布时间:2026-04-16 14:12:23 | 责任编辑:吴昊 | 浏览量:3 次

4月16日,蚂蚁灵波科技正式宣布开源流式三维重建模型 LingBot-Map。该模型突破性地实现了仅依靠单个普通 RGB 摄像头,即可在视频采集过程中实时估计相机位姿并重建场景三维结构。这一进展为机器人导航、自动驾驶及 AR 硬件等需要即时空间感知的应用场景,提供了高效、稳定且连续的在线建图能力。
技术层面,LingBot-Map 采用流式处理架构,改变了传统方法需预先采集完整序列再统一处理的局限,实现了边接收画面边输出定位与结构的实时交互。在国际主流评测中,该模型表现出色:在极具挑战的 Oxford Spires 数据集上,其轨迹误差仅为此前最优流式方法的三分之一,甚至优于部分离线处理算法。性能指标显示,LingBot-Map 支持约20FPS 的实时推理,并能在超万帧的长视频运行中保持精度几乎不衰减,兼顾了高精度、高速度与长时稳定性。
此次 LingBot-Map 的发布,是蚂蚁灵波继深度估计(Depth)、大语言动作模型(VLA)及世界模型(World)等系列成果后的又一重要动作。通过补齐实时空间理解这一核心环,蚂蚁灵波进一步夯实了其具身智能“基座”的完整性。该模型的开源不仅降低了高精度三维感知的硬件门槛,更将加速具身智能设备在复杂动态环境中的感知与决策进化。

蚂蚁灵波科技发布开源项目 LingBot-Map:实现实时三维重建的单摄像头流式处理

这是一篇关于蚂蚁灵波科技开源 LingBot-Map:支持单摄像头实时流式三维重建的文章,内容值得关注。

©️版权声明:
本网站(https://aigc.izzi.cn)刊载的所有内容,包括文字、图片、音频、视频等均在网上搜集。
访问者可将本网站提供的内容或服务用于个人学习、研究或欣赏,以及其他非商业性或非盈利性用途,但同时应遵守著作权法及其他相关法律的规定,不得侵犯本网站及相关权利人的合法权利。除此以外,将本网站任何内容或服务用于其他用途时,须征得本网站及相关权利人的书面许可,并支付报酬。
本网站内容原作者如不愿意在本网站刊登内容,请及时通知本站,予以删除。

最新Ai信息

最新Ai工具

热门AI推荐