全新登场:B站上的AniSora V3 打造更快速、高效的动漫视频创作工具
发布时间:2025-07-07 09:31:17 | 责任编辑:吴昊 | 浏览量:7 次
近日,B 站宣布其开源的动漫视频生成模型 AniSora 迎来了重磅更新,版本升级至 AniSora V3。这一更新不仅提升了生成视频的质量和流畅度,还扩展了动漫风格的多样性,为动漫、漫画和 VTuber 内容创作者提供了更强大的工具支持。
AniSora V3的亮点在于其强大的功能,它能够一键生成多种风格的动漫视频镜头,涵盖从番剧片段、国产动画到漫画改编及鬼畜(MAD)等内容。基于 B 站之前开源的 CogVideoX-5B 和 Wan2.1-14B 模型,V3版本结合了强化学习与人类反馈(RLHF)技术,显著提高了视频的视觉质量和动作一致性。
具体来说,AniSora V3引入了时空掩码模块,这一优化使得模型在处理复杂动画任务时更为出色。例如,用户可以通过简单的提示,如 “五位女孩在镜头放大时起舞”,生成流畅且自然的舞蹈动画,镜头与角色动作的同步表现极佳。此外,V3版本还扩展了数据集,利用超过1000万个高质量动漫视频片段进行训练,确保生成内容在风格和细节上的一致性。
硬件方面,AniSora V3新增对华为 Ascend910B NPU 的支持,基于国产芯片进行训练,推理速度提升约20%。用户生成4秒视频的时间仅需2-3分钟,效率大幅提升。同时,V3在多任务处理能力上也有显著增强,支持从单帧图像生成视频、关键帧插值及唇部同步等功能,特别适合快速制作漫画改编和 VTuber 内容。
最新的基准测试显示,AniSora V3在角色一致性和动作流畅度方面达到了业内顶尖水平,尤其是在处理复杂的动画动作时表现尤为出色。此外,V3还引入了针对动漫视频生成的 RLHF 框架,确保生成内容更符合人类的审美需求。开发者们也开始利用 V3创建定制化插件,进一步提升特定动漫风格的生成效果。
AniSora V3不仅在技术上取得了突破,还为创作者们提供了一个极具潜力的创作平台。无论是制作预告片还是短篇动画,它都能帮助用户快速实现自己的创意。
开源地址:https://github.com/bilibili/Index-anisora/tree/main
B站开源的动漫视频生成模型AniSora V3已于2025年7月2日震撼上线。作为Index-AniSora项目的一部分,AniSora V3在原有基础上进一步优化了生成质量、动作流畅度和风格多样性,为动漫、漫画及VTuber内容创作者提供了更强大的工具。以下是AniSora V3的主要特点和升级:
技术升级
-
时空掩码模块优化:增强了时空控制能力,支持更复杂的动画任务,如精细的角色表情控制、动态镜头移动和局部图像引导生成。例如,提示“五位女孩在镜头放大时起舞,左手上举至头顶再下放至膝盖”能生成流畅的舞蹈动画,镜头与角色动作同步自然。
-
数据集扩展:V3继续依托超过1000万高质量动漫视频片段(从100万原始视频中提取)进行训练,新增数据清洗流水线,确保生成内容的风格一致性和细节丰富度。
-
硬件优化:新增对华为Ascend910B NPU的原生支持,完全基于国产芯片训练,推理速度提升约20%,生成4秒高清视频仅需2-3分钟。
-
多任务学习:强化了多任务处理能力,支持从单帧图像生成视频、关键帧插值到唇部同步等功能,特别适合漫画改编和VTuber内容创作。
功能特点
-
一键生成多种风格:支持一键生成多种动漫风格的视频镜头,包括番剧片段、国创动画、漫画改编、VTuber内容、动画PV、鬼畜(MAD)等。
-
高分辨率输出:生成视频支持高达1080p,确保在社交媒体、流媒体平台上的专业呈现。
-
复杂动作表现突出:在最新基准测试中,AniSora V3在VBench和双盲主观测试中,角色一致性和动作流畅度均达到业界顶尖水平(SOTA),尤其在复杂动作(如违反物理规律的夸张动漫动作)上表现突出。
应用场景
-
单图转视频:用户上传一张高质量动漫图像,配合文本提示,即可生成动态视频,保持角色细节和风格一致。
-
漫画改编:从漫画帧生成带唇部同步和动作的动画,适合快速制作预告片或短篇动画。
-
VTuber与游戏:支持实时生成角色动画,助力独立创作者和游戏开发者快速测试角色动作。
开源与社区支持
AniSora V3的完整训练和推理代码已于2025年7月2日在GitHub上更新,开发者可通过Hugging Face访问模型权重及948个动画视频的评估数据集。B站强调,AniSora是“对动漫世界的开源礼物”,鼓励社区协作优化模型。
AniSora V3的发布进一步降低了动漫创作门槛,使独立创作者和小型团队能以低成本实现高质量动画制作。它专注于动漫领域,填补了市场空白,相比其他通用视频生成模型,AniSora V3在动漫风格视频生成方面更具优势。
本网站(https://aigc.izzi.cn)刊载的所有内容,包括文字、图片、音频、视频等均在网上搜集。
访问者可将本网站提供的内容或服务用于个人学习、研究或欣赏,以及其他非商业性或非盈利性用途,但同时应遵守著作权法及其他相关法律的规定,不得侵犯本网站及相关权利人的合法权利。除此以外,将本网站任何内容或服务用于其他用途时,须征得本网站及相关权利人的书面许可,并支付报酬。
本网站内容原作者如不愿意在本网站刊登内容,请及时通知本站,予以删除。