Soul 开源实时数字人生成模型SoulXFlashTalk 实现亚秒级延迟
发布时间:2026-04-24 11:59:24 | 责任编辑:张毅 | 浏览量:3 次
近日,Soul AI Lab 宣布正式开源业内首个拥有14亿参数的实时数字人生成模型 ——SoulXFlashTalk。这个模型的特别之处在于,它能够实现亚秒级延迟和每秒32帧的高帧率,为行业提供了一套完整的实时交互解决方案。
SoulXFlashTalk 的开源意味着开发者将可以轻松访问相关的项目页面、技术报告、源代码和模型权重,形成一个全面开放的体系。这一举措不仅能有效降低行业内的研发门槛,也将为更多的创新项目提供基础支持。值得一提的是,早在去年10月,Soul 便已经开源了语音合成模型 SoulXPodcast,此次的开源标志着 Soul 在 “语音 + 视觉” 双模态开源矩阵的布局上又迈出了重要一步。
Soul 的开源战略并不仅限于技术的共享,更是希望通过开放的方式,促进 AI 生态的共同发展。公司表示,未来将继续坚持开源路线,开放更多 AI 技术成果,从而推动 AI 与社交领域的创新与融合。
随着 Soul 在多模态 AI 生态布局的不断完善,业内专家预测,这将为社交网络、在线教育、虚拟现实等多个行业带来颠覆性的变化。可以预见,Soul 的努力将为未来的数字交互体验设定新的标杆,让我们拭目以待。
划重点:
🌟 Soul AI Lab 推出14B 参数的实时数字人生成模型 SoulXFlashTalk,具备快速响应能力和高帧率。
🚀 开源带来项目页面、技术报告、源代码及模型权重,降低研发门槛,鼓励更多创新。
🤝 Soul 将继续推进开源战略,推动 AI 与社交创新发展,构建多模态 AI 生态。
本网站(https://aigc.izzi.cn)刊载的所有内容,包括文字、图片、音频、视频等均在网上搜集。
访问者可将本网站提供的内容或服务用于个人学习、研究或欣赏,以及其他非商业性或非盈利性用途,但同时应遵守著作权法及其他相关法律的规定,不得侵犯本网站及相关权利人的合法权利。除此以外,将本网站任何内容或服务用于其他用途时,须征得本网站及相关权利人的书面许可,并支付报酬。
本网站内容原作者如不愿意在本网站刊登内容,请及时通知本站,予以删除。
上一篇: 万兴科技发布万兴脑图 AI,引领思维导图迈入新时代
下一篇: 特斯拉官宣:车载语音系统将集成豆包能力
