LLM2D
AniSora:探索Sora时代的动画视频生成前沿
AniSora: Exploring the Frontiers of Animation Video Generation in the Sora Era
作者: Yudong Jiang, Baohan Xu, Siqian Yang, Mingyu Yin, Jing Liu, Chao Xu, Siqi Wang, Yidi Wu, Bingwen Zhu, Xinwen Zhang, Xingyu Zheng, Jixuan Xu, Yue Zhang, Jinlong Hou, Huyang Sun
发布日期: 5/14/2025
arXiv ID: oai:arXiv.org:2412.10255v4

摘要

arXiv:2412.10255v4 动画类型: 替换-交叉 摘要:动画在近期的电影和电视行业中获得了显著的关注。尽管像Sora、Kling和CogVideoX等先进的视频生成模型在生成自然视频方面取得了成功,但在处理动画视频方面缺乏同样的有效性。由于其独特的艺术家风格、违反物理定律以及夸张的运动,评估动画视频生成也是一项巨大的挑战。本文中,我们介绍了专门为动画视频生成设计的综合系统AniSora,该系统包括数据处理管道、可控生成模型和评估基准。通过包含超过10M高质量数据的数据处理管道的支持,生成模型集成了一个时空掩模模块,以促进关键动画生产功能,如图像到视频生成、帧内插和局部图像引导动画。我们还收集了一个包含948个不同动画视频的评估基准,并专门开发了用于动画视频生成的评估指标。整个项目可公开访问于https://github.com/bilibili/Index-anisora/tree/main。