发布全新AI视频模型Waver 1.0,字节跳动带来多风格视频创作能力
发布时间:2025-08-27 15:13:12 | 责任编辑:吴昊 | 浏览量:15 次
近日,字节的新AI视频模型Waver1.0正式发布,这是一款集多种功能于一体的视频生成模型,具有更强大的能力。Waver1.0支持文本到视频和图像到视频的转换,为用户提供了一种全新的创作体验。该模型在视频生成的质量和效果上,显著优于现有的开源和闭源模型。
在模型性能方面,Waver1.0在 Waver-Bench1.0和 Hermes Motion Testset 上的表现非常突出。在运动质量、视觉质量和提示跟随性等方面,经过人工评估,Waver1.0均显示出其优越性。
Waver1.0还具备多镜头叙事的能力,能够生成多镜头的连贯叙事视频。在镜头切换和时空转换时,模型可以保证核心主题、视觉风格和整体氛围的高度一致性,确保视频的连续性。此外,Waver1.0支持生成长达10秒的视频,使情感和动作表达更为完整。
在艺术风格上,Waver1.0支持多种艺术风格的视频生成,包括极致现实、动画、粘土、毛绒等,为用户带来丰富多彩的视觉盛宴。在复杂运动的生成方面,Waver1.0在体育场景中也展现了良好的表现,尽管在一些复杂领域仍需进一步提升。
Waver1.0也扩展了其运动能力,适用于动物运动的生成,为用户提供了新的创意可能性。无论你来自何处,都可以利用 Waver1.0实现你的创造力,共同为人工智能生成内容(AIGC)创造更美好的未来。
项目:https://www.waver.video/
划重点:
🌟 Waver1.0是一款强大的全能视频生成模型,支持文本和图像转视频。
🎨 支持多种艺术风格和长达10秒的视频生成,提供丰富的视觉效果。
🏆 在运动质量和视觉质量上表现优于现有的模型,适用于多镜头叙事。
。Waver 1.0 基于整流流 Transformer 架构,具备以下核心特点:
核心功能
-
一体化生成:在一个集成框架内同时支持文本到视频(T2V)、图像到视频(I2V)和文本到图像(T2I)生成
。
-
高分辨率与灵活长度:支持高达 1080p 的高分辨率视频生成,视频长度灵活(2-10 秒),可适配各种宽高比
。
-
卓越运动建模:擅长捕捉复杂运动,实现自然、真实的动作表现,尤其在大规模人物动作和体育场景中表现突出
。
-
多样化艺术风格:支持从写实到赛博朋克、从吉卜力动画到迪士尼风格等多种艺术风格,用户可通过提示标签精准控制生成风格
。
使用与开源信息
-
在线体验:目前已上线 Discord 平台,用户可前往 http://www.waver.video 体验
。
-
开源潜力:项目在 GitHub 上有仓库(https://github.com/FoundationVision/Waver),未来可能开源
。
性能表现
-
权威榜单排名:截至 2025 年 8 月,在 Artificial Analysis 的 T2V 和 I2V 排行榜上均跻身前三,性能优于现有开源模型,部分指标达到或超越当前最先进的商业解决方案
。
总之,Waver 1.0 的发布标志着字节跳动在 AI 视频生成领域取得了重要突破,为创作者提供了高效、高质量且风格多样的视频生成解决方案。
本网站(https://aigc.izzi.cn)刊载的所有内容,包括文字、图片、音频、视频等均在网上搜集。
访问者可将本网站提供的内容或服务用于个人学习、研究或欣赏,以及其他非商业性或非盈利性用途,但同时应遵守著作权法及其他相关法律的规定,不得侵犯本网站及相关权利人的合法权利。除此以外,将本网站任何内容或服务用于其他用途时,须征得本网站及相关权利人的书面许可,并支付报酬。
本网站内容原作者如不愿意在本网站刊登内容,请及时通知本站,予以删除。