LLM2D

摘要

arXiv:2412.10255v4 动画类型: 替换-交叉摘要：动画在近期的电影和电视行业中获得了显著的关注。尽管像Sora、Kling和CogVideoX等先进的视频生成模型在生成自然视频方面取得了成功，但在处理动画视频方面缺乏同样的有效性。由于其独特的艺术家风格、违反物理定律以及夸张的运动，评估动画视频生成也是一项巨大的挑战。本文中，我们介绍了专门为动画视频生成设计的综合系统AniSora，该系统包括数据处理管道、可控生成模型和评估基准。通过包含超过10M高质量数据的数据处理管道的支持，生成模型集成了一个时空掩模模块，以促进关键动画生产功能，如图像到视频生成、帧内插和局部图像引导动画。我们还收集了一个包含948个不同动画视频的评估基准，并专门开发了用于动画视频生成的评估指标。整个项目可公开访问于https://github.com/bilibili/Index-anisora/tree/main。