LLM2D

摘要

arXiv:2504.08685v1 论文类型: cross 摘要: 本技术报告介绍了一种成本效益高的视频生成基础模型训练策略。我们使用大约665,000个H100 GPU小时从头开始训练了一个中型研究模型Seaweed-7B，包含约70亿个参数（7B）。尽管使用了较为适度的计算资源进行训练，Seaweed-7B在性能上仍然表现出与更大规模的当前视频生成模型相当，甚至超越的效果。在计算资源受限的情况下，设计选择尤为重要。本技术报告强调了对于中型扩散模型性能提升的关键设计决策。实验证明，我们做出了以下两点观察：(1) Seaweed-7B在性能上能达到与在大量GPU资源下训练的大规模模型相当，甚至超越的效果；(2) 具备较强泛化能力的我们的模型可以通过轻量级微调或继续训练，有效地适应广泛的应用场景。访问项目页面: https://seaweed.video/