摘要
arXiv:2504.00983v1 类型: cross
摘要: 我们引入了WorldScore基准测试,这是首个统一的生成世界基准测试。我们将生成世界分解为一系列带有显式相机路径布局规范的下一个场景生成任务,从而统一评估从3D和4D场景生成到视频生成模型的各种方法。WorldScore基准测试包含了一个精心策划的数据集,其中包括3,000个测试示例,涵盖了各种各样的世界:静态和动态,室内和室外,具象和风格化。WorldScore指标通过三个关键方面评估生成的世界:可控性、质量和动态性。通过对19个代表性模型的广泛评估,包括开源和闭源模型,我们揭示了每个模型类别中的关键见解和挑战。我们的数据集、评估代码和排行榜可以在https://haoyi-duan.github.io/WorldScore/找到。