清华大学团队发布GUAVA:在0.1秒内将图片转换为3D数字模型
发布时间:2025-09-10 09:41:39 | 责任编辑:张毅 | 浏览量:89 次
在数字人领域,清华深研院与国际数字经济研究院的中国团队近日推出了名为 GUAVA 的新技术,标志着数字人制作进入了一个全新的时代。通过仅一张照片,GUAVA 能够在0.1秒内生成一个高质量的3D 高斯化身,并实时驱动,画面流畅度超过50帧每秒。
传统上,创建高质量的3D 数字人需要复杂的多视角拍摄,或者耗时耗力的视频数据训练,往往需要几个小时才能完成。而 GUAVA 的出现,无疑是对这一过程的颠覆。与其他方法相比,GUAVA 的重建速度可谓惊人,所需时间仅为0.1秒,而其他算法如 ExAvatar 需要2.4小时,GaussianAvatar 需1.3小时,甚至 GART 也需7分钟。这样的速度让人们惊叹不已。
GUAVA 的优越表现得益于其创新的技术架构,主要包含两个关键组件:EHM 模型和3D 高斯泼溅。EHM 模型通过结合 SMPLX 和 FLAME 技术,确保了人脸表情的高保真度和精准控制,而3D 高斯泼溅则通过将场景拆分为数百万个3D 高斯球体,从而实现快速渲染。这种方法使得 GUAVA 在身份一致性上也表现出色,相关指标超过了竞争对手的水平。
在实际应用方面,GUAVA 能够为自媒体、直播、电子商务和教育等多个领域提供强大的支持。自媒体用户可以通过一张图片迅速创建可定制的角色,极大缩短了制作周期;直播主播可以轻松上传自拍,快速转换为虚拟形象;电商平台则可以实现千人千面的虚拟模特;教育行业也可利用虚拟教师进行沉浸式教学。这些应用场景展示了 GUAVA 技术的广泛潜力。
清华深研院与 IDEA 研究院在没有依赖于融资和概念炒作的情况下,通过实际成果展现了他们在数字人技术领域的领导地位。他们的研究不仅在 ICCV2025大会上获得认可,更是通过开源代码的方式让全球的同行得以共享这一创新成果。
参考资料:
https://github.com/Pixel-Talk/GUAVA
https://eastbeanzhang.github.io/GUAVA/
划重点:
- 🚀 GUAVA 技术能在0.1秒内通过一张照片生成3D 数字人,速度惊人。
- 🎨 其核心技术 EHM 模型和3D 高斯泼溅确保了高质量的表情还原和快速渲染。
- 💡 GUAVA 广泛应用于自媒体、直播、电商和教育等多个领域,提升效率与用户体验。
本网站(https://aigc.izzi.cn)刊载的所有内容,包括文字、图片、音频、视频等均在网上搜集。
访问者可将本网站提供的内容或服务用于个人学习、研究或欣赏,以及其他非商业性或非盈利性用途,但同时应遵守著作权法及其他相关法律的规定,不得侵犯本网站及相关权利人的合法权利。除此以外,将本网站任何内容或服务用于其他用途时,须征得本网站及相关权利人的书面许可,并支付报酬。
本网站内容原作者如不愿意在本网站刊登内容,请及时通知本站,予以删除。