LLM2D

摘要

arXiv:2504.08685v2 Announce Type: replace-cross 摘要：本技术报告呈现了一种成本高效的视频生成基础模型训练策略。我们提出了一种中型研究模型，名为Seaweed-7B，具有约70亿参数（7B），并在665,000个H100 GPU小时的资源下从头开始训练。尽管使用了中等规模的计算资源进行训练，Seaweed-7B在性能上仍然与更大规模的当代视频生成模型不相上下。在资源受限的环境中，设计选择尤为重要。本技术报告强调了增强中型扩散模型性能的关键设计决策。实证研究表明：（1）Seaweed-7B在性能上能够达到与在更大量GPU资源下训练的大型模型相当，甚至超越大型模型的效果；（2）我们的模型表现出色，具备较强的泛化能力，可以通过轻量级微调或继续训练有效地适应广泛的应用场景。更多详情请参见项目页面：https://seaweed.video/