LLM2D
模型库-索拉竞赛解决方案技术报告
Technical Report: Competition Solution For Modelscope-Sora
作者: Shengfu Chen, Hailong Liu, Wenzhao Wei
发布日期: 10/11/2024
arXiv ID: oai:arXiv.org:2410.07194v1

摘要

本报告介绍了 Modelscope-Sora 挑战中采用的方法,该挑战侧重于为视频生成模型微调数据。该挑战评估参与者在特定计算约束下分析、清理和生成用于基于视频的文本到视频任务的高质量数据集的能力。所提供的方法包括数据处理技术,例如视频描述生成、过滤和加速。本报告概述了用于提高训练数据质量的程序和工具,以确保文本到视频生成模型的性能得到改善。