为二次元爱好者设计!B站发布Index-AniSora开源顶级动画视频生成模型
发布时间:2025-05-20 10:14:58 | 责任编辑:张毅 | 浏览量:3 次
2025年5月19日,哔哩哔哩(B站)宣布开源其最新的动画视频生成模型——Index-AniSora,这一创新技术为二次元风格视频的生成带来了革命性的突破。Index-AniSora支持多种二次元风格视频镜头的一键生成,包括番剧、国创、漫改动画、VTuber、动画PV和鬼畜动画等,极大地提升了动画内容的生产效率与质量。
Index-AniSora的技术原理基于B站提出的AniSora模型,该模型已经在国际人工智能会议IJCAI2025上被接收。在此基础上,B站进一步提出了首个专为二次元视频生成打造的强化学习技术框架,通过人类反馈对动画视频生成进行对齐优化,从而全面提升生成内容的质量。
在技术实现方面,B站的研究团队构建了首个面向动漫领域的高质量奖励数据集,包含30,000条人工标注的动漫视频样本。该数据集从视觉外观和视觉一致性两个方面对视频质量进行评估,涵盖了视觉平滑度、视觉运动、视觉吸引力、文本与视频一致性、图像与视频一致性以及角色一致性等多个维度。基于这些维度,研究团队提出了AnimeReward,一个专为动漫视频生成对齐设计的多维度高可信奖励系统。
为了进一步提升模型的对齐性能,研究团队提出了差距感知偏好优化(GAPO),将正负样本对之间的偏好差距融入损失函数,从而提升对齐训练的效率和最终性能。实验结果表明,通过AnimeReward和GAPO优化后的模型在多个评价维度上均显著优于基线模型和监督微调(SFT)模型,生成的动画视频更贴近人类偏好。
B站的这一开源项目不仅为动画视频生成领域带来了新的技术突破,也为广大开发者和爱好者提供了宝贵的资源和工具。通过Index-AniSora,用户可以轻松将喜欢的漫画转化为生动的动画效果,支持多种小众画风,效果更加丰富,彻底告别“PPT动画”时代。这一技术的开源,无疑将推动二次元内容创作的进一步发展,为动漫爱好者和创作者带来更多的可能性。
地址:
https://github.com/bilibili/Index-anisora/tree/main
模型链接:
https://modelscope.cn/models/bilibili-index/Index-anisora
体验链接:
https://modelscope.cn/studios/bilibili-index/Anisora
B站开源的Index-AniSora模型是专为二次元风格动画视频生成而设计的顶尖技术工具,以下是关于该模型的详细介绍:
技术原理与架构
-
基于AniSora模型:Index-AniSora的技术原理基于B站提出的AniSora模型,该模型已被IJCAI2025接收。
-
强化学习框架:模型采用了专为二次元视频生成打造的强化学习技术框架,通过人类反馈对动画视频生成进行对齐优化,使生成内容更贴近人类偏好。
-
扩散生成框架与时空掩码机制:开发了统一的扩散生成框架,并引入时空掩码机制,灵活支持图生视频、插帧补全和局部控制等任务,能够实现对角色口型、动作乃至局部区域的精细控制。
数据集与评估体系
-
高质量奖励数据集:构建了首个面向动漫领域的高质量奖励数据集,包含30,000条人工标注的动漫视频样本,涵盖视觉平滑度、运动感、视觉吸引力、文本一致性、图像一致性与角色一致性等六个关键维度。
-
AnimeReward奖励模型与GAPO算法:基于该数据集,设计了AnimeReward奖励模型,并提出差距感知偏好优化算法(GAPO),通过显式建模正负样本间的偏好差距,强化奖励信号,提升模型对齐性能。
-
专用评估基准:设计了首个面向动画视频的专用评估基准,涵盖多个二次元子类型,填补了现有自然视频评估体系的空白。
开源内容与版本
-
AniSoraV1.0:基于CogVideoX-5B基座模型训练,支持视频局部区域引导控制、时序引导控制等,适合4090显卡部署,覆盖80%的应用场景。
-
AniSoraV2.0:基于Wan2.1-14B基座模型训练,效果更稳定,覆盖90%的应用场景。采用蒸馏加速方案,提升推理性能,并支持国产芯片华为910B的高效分布式训练。
-
其他开源内容:包括训练数据集构建的全链路模型、基于动画数据优化的Benchmark系统、标准测试数据集,以及基于动画领域人类偏好强化学习模型及训练框架。
特点与优势
-
多种二次元风格支持:支持番剧、国创、漫改动画、VTuber、动画PV和鬼畜动画等多种二次元风格视频镜头的一键生成。
-
高效创作:用户只需输入简单的指令或提示词,即可快速生成高质量的动画视频,大大提高了创作效率。
-
符合ACG审美:通过定向优化,模型能够更好地理解动漫语境与ACG审美,生成更贴合创作者需求的动画内容。
使用场景与意义
-
创作者:帮助动画创作者快速生成高质量的动画视频,节省时间和精力。
-
开发者:为开发者提供了强大的技术工具,推动二次元内容创作的创新和发展。
-
二次元爱好者:让爱好者能够轻松将喜欢的漫画转化为生动的动画效果,支持多种小众画风。
Index-AniSora模型的开源为动画视频生成领域带来了新的技术突破,推动了二次元内容创作的进一步发展。
本网站(https://aigc.izzi.cn)刊载的所有内容,包括文字、图片、音频、视频等均在网上搜集。
访问者可将本网站提供的内容或服务用于个人学习、研究或欣赏,以及其他非商业性或非盈利性用途,但同时应遵守著作权法及其他相关法律的规定,不得侵犯本网站及相关权利人的合法权利。除此以外,将本网站任何内容或服务用于其他用途时,须征得本网站及相关权利人的书面许可,并支付报酬。
本网站内容原作者如不愿意在本网站刊登内容,请及时通知本站,予以删除。
上一篇: ai会议记录工具在哪?
下一篇: ai会议记录工具怎么用?