百度蒸汽机2.0重磅升级至视频生成大模型,行业独家推出多人有声视频创造功能
发布时间:2025-08-21 16:44:44 | 责任编辑:吴昊 | 浏览量:6 次
百度蒸汽机(MuseSteamer)音视频一体化模型迎来重要里程碑,完成2.0版本升级,在行业内首次实现多人有声视频一体化生成功能,标志着AI视频生成技术进入新的发展阶段。
此次2.0版本最大亮点是在行业内首次实现多人有声视频一体化生成,突破了此前单人视频生成的技术限制。该技术能够同时处理多个人物的视觉呈现和音频同步,为用户创造更加丰富和复杂的视频内容提供了可能。
百度蒸汽机2.0提供了完整的产品矩阵,满足不同用户需求,其Turbo版、Lite版、Pro版及全系有声版全面开放。
现在,用户可通过多种渠道体验百度蒸汽机2.0的强大功能:个人用户可通过百度搜索"百度蒸汽机"直接使用,或登录"绘想"平台获得完整体验。企业用户则可在百度千帆平台享受高性能视频生成服务,满足商业级应用需求。
百度蒸汽机2.0在多人有声视频生成领域的技术突破,不仅提升了AI视频生成的实用性,也为内容创作、教育培训、营销推广等多个行业提供了新的解决方案。
8月21日,百度正式发布**蒸汽机2.0(MuseSteamer)**视频生成大模型,完成了对原有音视频一体化模型的重大升级,在行业内首次实现了“多人有声视频一体化生成”。
核心亮点如下:
-
技术突破:
蒸汽机2.0基于多模态时空规划、中文场景深度优化与音视端到端建模等前沿技术,能够自主协调多角色的身份、情感与互动逻辑,实现电影级高清画面、复杂运镜、自然语音与环境音效的同步输出。 -
产品形态:
提供Turbo版、Lite版、Pro版及全系有声版,已全面开放。用户可通过百度搜索“百度蒸汽机”或登录“绘想”平台体验,企业用户则可通过“千帆平台”接入高性能服务。 -
应用落地:
该系列大模型已率先在百度搜索、营销内容生成等多个场景中应用,显著降低了视频创作成本,定价低至行业平均的70%。 -
行业意义:
作为全球首个支持中文音视频一体化生成的I2V模型,蒸汽机2.0被认为是AI视频生成领域的一次“从渐进式创新到指数级跃迁”的关键升级。
此外,百度也提醒用户警惕近期在海外出现的假冒“蒸汽机”网站,务必通过官方渠道获取服务。
本网站(https://aigc.izzi.cn)刊载的所有内容,包括文字、图片、音频、视频等均在网上搜集。
访问者可将本网站提供的内容或服务用于个人学习、研究或欣赏,以及其他非商业性或非盈利性用途,但同时应遵守著作权法及其他相关法律的规定,不得侵犯本网站及相关权利人的合法权利。除此以外,将本网站任何内容或服务用于其他用途时,须征得本网站及相关权利人的书面许可,并支付报酬。
本网站内容原作者如不愿意在本网站刊登内容,请及时通知本站,予以删除。