首页 > 快讯 > 阿里发布可于手机运行的3D虚拟人应用MNN TaoAvatar,支持虚拟客服与主播功能

阿里发布可于手机运行的3D虚拟人应用MNN TaoAvatar,支持虚拟客服与主播功能

发布时间:2025-06-13 11:09:03 | 责任编辑:吴昊 | 浏览量:10 次

阿里巴巴集团在数字人技术领域再下一城,正式开源了一款基于MNN框架的3D数字人应用——MNN TaoAvatar。这款创新技术将高保真的3D虚拟形象生成与实时交互能力带到移动设备,为直播、虚拟社交和AR应用等领域带来全新可能性。以下,小编将为您详细解析这款令人瞩目的技术突破。
MNN TaoAvatar:手机上的3D数字人“魔法棒”
MNN TaoAvatar是阿里巴巴基于其开源的轻量级深度学习推理框架MNN开发的3D数字人技术。与传统的平面化Live2D技术不同,MNN TaoAvatar支持真3D虚拟角色的实时生成与驱动,能够在手机等移动设备上以高达90FPS的帧率运行,带来流畅的交互体验。
该技术结合了3D高斯溅射(3D Gaussian Splatting)技术,通过多视角图像序列生成照片级逼真的3D全身虚拟形象。无论是面部表情、手势还是身体姿态,MNN TaoAvatar都能实现毫米级的精细控制,确保虚拟角色的口型、表情和动作自然同步,为用户带来栩栩如生的视觉体验。
技术亮点:轻量高效,多模态驱动
MNN TaoAvatar的成功离不开MNN框架的强大性能支持。作为阿里巴巴自2019年开源的推理引擎,MNN以其轻量级、高性能和跨平台兼容性在业内广受好评。MNN TaoAvatar在此基础上进一步优化,具备以下核心优势:
实时面部捕捉:通过深度学习算法,MNN TaoAvatar能够精准捕捉用户的喜怒哀乐,并以低延迟同步到3D虚拟角色,适用于直播、虚拟会议等实时交互场景。
轻量级部署:得益于MNN的模型量化和内存优化技术,MNN TaoAvatar能够在普通手机上流畅运行,无需高端硬件支持,大幅降低使用门槛。
多模态支持:除了面部表情捕捉,MNN TaoAvatar还支持语音、文本和图像生成等多种输入方式,为开发者提供丰富的创作空间。
开源生态:作为阿里开源战略的一部分,MNN TaoAvatar提供完善的API和工具,方便开发者将其集成到Android和iOS应用中,助力快速开发与部署。
此外,MNN TaoAvatar通过知识蒸馏技术和可学习的高斯混合形状优化了非刚性变形处理,确保虚拟形象在复杂姿态下依然保持高保真度。这种技术创新使其在资源受限的移动设备上也能实现高质量渲染,堪称3D数字人领域的“黑科技”。
应用场景:从直播带货到元宇宙
MNN TaoAvatar的应用潜力十分广泛,已在阿里巴巴内部的多个场景中得到验证。例如,在淘宝和优酷等平台中,3D数字人技术已用于提升直播带货和虚拟活动的用户体验。以下是一些典型应用场景:
电商直播:通过逼真的3D虚拟主播,MNN TaoAvatar能够提升用户沉浸感,同时降低人力成本。
虚拟社交与会议:用户可创建个性化的3D虚拟形象,参与虚拟会议或社交互动,增强沉浸式体验。
元宇宙与AR:MNN TaoAvatar支持在AR设备(如Apple Vision Pro)上运行,为元宇宙和虚拟现实应用提供技术支持。
在线教育与娱乐:通过生动的虚拟角色,MNN TaoAvatar可为教育和游戏内容增添趣味性和互动性。
值得一提的是,MNN TaoAvatar的低存储需求和高兼容性使其尤其适合移动端和AR设备,为未来元宇宙的普及奠定了技术基础。
开源赋能:阿里数字人技术的又一里程碑
MNN TaoAvatar的开源标志着阿里巴巴在数字人技术领域的又一重要突破。此前,阿里通义实验室已推出EchoMimic、OmniTalker等数字人项目,展现了其在该领域的深厚积累。而MNN TaoAvatar的发布,进一步壮大了MNN生态,为全球开发者提供了探索3D数字人应用的便捷工具。
项目地址已公开(https://github.com/alibaba/MNN),开发者可通过丰富的API和文档快速上手,定制属于自己的3D数字人应用。小编认为,MNN TaoAvatar的开源不仅降低了3D数字人技术的开发门槛,也将加速其在商业场景中的普及,为内容创作者和企业提供强大的技术支持。
更多详情,请访问项目官网:https://pixelai-team.github.io/TaoAvatar/ 或 GitHub地址:https://github.com/alibaba/MNN。[](https://ai-bot.cn/taoavatar/)[](https://www.aitop100.cn/infomation/details/26939.html)

阿里发布可于手机运行的3D虚拟人应用MNN TaoAvatar,支持虚拟客服与主播功能

阿里巴巴开源的3D数字人应用MNN TaoAvatar是一款基于MNN框架开发的创新技术,能够在手机等移动设备上运行,生成高保真的3D虚拟形象并支持实时交互。以下是关于MNN TaoAvatar的详细介绍:

技术特点

  • 实时面部捕捉:通过深度学习算法,能够精准捕捉用户的面部表情,并以低延迟同步到3D虚拟角色上,适用于直播、虚拟会议等实时交互场景。

  • 轻量级部署:得益于MNN框架的优化,MNN TaoAvatar能够在普通手机上流畅运行,无需高端硬件支持,大幅降低了使用门槛。

  • 多模态支持:除了面部表情捕捉,还支持语音、文本和图像生成等多种输入方式,为开发者提供了丰富的创作空间。

  • 高帧率运行:能够在手机等移动设备上以高达90FPS的帧率运行,带来流畅的交互体验。

  • 开源生态:作为阿里开源战略的一部分,提供完善的API和工具,方便开发者将其集成到Android和iOS应用中。

应用场景

  • 虚拟客服:可以创建虚拟客服形象,通过语音和文本交互为用户提供服务,提升用户体验。

  • 虚拟主播:在电商直播中,虚拟主播可以24小时不间断地介绍产品,增加直播的趣味性和互动性,同时降低对真人出镜的依赖。

  • 虚拟社交与会议:用户可以创建个性化的3D虚拟形象,参与虚拟会议或社交互动,增强沉浸式体验。

  • 教育与培训:教育机构可以创建虚拟讲师,通过生动的虚拟角色提升在线课程的互动性和吸引力。

  • 娱乐与游戏:可用于虚拟偶像、游戏角色动画等场景,为用户提供沉浸式的视觉体验。

核心优势

  • 高保真渲染:结合3D高斯溅射技术,通过多视角图像序列生成照片级逼真的3D全身虚拟形象。

  • 低成本高效率:仅需普通手机摄像头即可替代传统动捕设备,显著降低直播场景的部署门槛与成本。

  • 快速开发:制作周期缩短至一周内,成本仅为传统CG方案的1/30。

开发者支持

  • 开源地址:项目已在GitHub开源,开发者可以通过丰富的API和文档快速上手,定制属于自己的3D数字人应用。

  • 实际验证:已在阿里巴巴内部的多个场景中得到验证,例如淘宝和优酷等平台的直播和短视频功能。

MNN TaoAvatar的开源为3D数字人技术的普及打开了新局面,无论是直播带货的创意升级,还是虚拟展示的沉浸式体验,都为开发者提供了强大的工具支持。

©️版权声明:
本网站(https://aigc.izzi.cn)刊载的所有内容,包括文字、图片、音频、视频等均在网上搜集。
访问者可将本网站提供的内容或服务用于个人学习、研究或欣赏,以及其他非商业性或非盈利性用途,但同时应遵守著作权法及其他相关法律的规定,不得侵犯本网站及相关权利人的合法权利。除此以外,将本网站任何内容或服务用于其他用途时,须征得本网站及相关权利人的书面许可,并支付报酬。
本网站内容原作者如不愿意在本网站刊登内容,请及时通知本站,予以删除。

最新Ai信息

最新Ai工具

发表回复