阿里空间智能再获佳绩,高德FantasyWorld发布即跃居世界模型首位!
发布时间:2026-01-09 16:20:13 | 责任编辑:吴昊 | 浏览量:113 次
阿里巴巴旗下高德地图正式推出自研世界模型“FantasyWorld”,凭借海量真实导航数据优势,这一模型迅速在国际权威基准WorldScore Leaderboard上夺得综合得分第一,进一步扩展了阿里在AI基础模型领域的布局。FantasyWorld聚焦于高品质3D世界构建,正成为具身智能和自动驾驶领域的新焦点。
FantasyWorld的核心技术突破
FantasyWorld旨在为具身智能与通用人工智能(AGI)提供高质量3D世界模型。其创新在于:在冻结的视频基础模型骨干上,增设可训练的几何分支,实现“视频潜变量”和“隐式3D场”的联合建模,仅需一次前向计算即可完成。
这一设计显著提升了生成视频的视觉真实感,同时大幅改善多视角一致性和几何保真度。相比近期其他几何一致性方法,FantasyWorld在多视角协同、风格一致性以及极端视角(如180°旋转)下的物体形状与纹理保持上表现出色。模型生成的3D潜变量可直接解码为深度图或点云,支持下游任务无需额外优化。
登顶WorldScore:国际认可的实力证明
WorldScore是由斯坦福大学李飞飞团队主导的统一世界生成基准,涵盖静态/动态场景、可控性、一致性等多维度评估。目前,FantasyWorld在综合得分以及关键指标(如静态世界得分78.55、动态世界得分66.89)上位居榜首,超越多家国内外竞争模型。
相关论文已被ICLR2025、NeurIPS2025等顶会收录,高德方面表示模型将于近期开源,进一步推动学术与产业合作。
实际应用落地:飞行街景引领空间智能新体验
FantasyWorld已率先应用于高德地图的“飞行街景”功能。商家仅需上传几段手机视频,即可免费生成高保真3D虚拟漫游街景,帮助用户提前“身临其境”了解餐厅布局、座位区等细节,同时助力线下商家提升流量。
这一功能被视为“技术平权”的体现,降低了专业3D建模门槛。高德还内部成立了具身业务部,探索机器人、机器狗等方向,结合空间智能全面转向物理AI。
行业影响:世界模型时代加速到来
随着自动驾驶转向端到端视觉语言行动(VLA)方案,以及具身智能的迅猛发展,追求物理真实性和3D一致性的世界模型正变得至关重要。FantasyWorld的推出,不仅强化了阿里在多模态AI的版图,还凸显了中国企业在真实世界数据驱动下的空间智能优势。
小编观点:FantasyWorld标志着世界模型从视频生成向可交互3D模拟的跃进,将深刻影响AR/VR、机器人导航、数字孪生等领域的未来。高德凭借亿级用户数据积累,或将在物理AI赛道占据先机。小编将持续关注其开源进展与更多应用落地,为读者带来深度解读。
本网站(https://aigc.izzi.cn)刊载的所有内容,包括文字、图片、音频、视频等均在网上搜集。
访问者可将本网站提供的内容或服务用于个人学习、研究或欣赏,以及其他非商业性或非盈利性用途,但同时应遵守著作权法及其他相关法律的规定,不得侵犯本网站及相关权利人的合法权利。除此以外,将本网站任何内容或服务用于其他用途时,须征得本网站及相关权利人的书面许可,并支付报酬。
本网站内容原作者如不愿意在本网站刊登内容,请及时通知本站,予以删除。
