LLM2D

摘要

arXiv:2504.07334v2 宣告类型: 替换-交叉摘要: 本文介绍了Objaverse++，这是一份由人类专家增加详细属性注解的Objaverse精选子集。3D内容生成的最近进展得益于大规模数据集，如Objaverse，其中包含来自互联网的超过80万的3D对象。尽管Objaverse代表了最大的可用3D资产集合，但其用途受限于低质量模型的主导地位。为解决这一限制，我们手动为10,000个3D对象加上了详细的属性注解，包括美学质量评分、纹理颜色分类、多对象组合标志、透明度特性等。然后，我们训练了一个能够为Objaverse数据集中的其余部分进行注解的神经网络。通过实验和生成结果的用户研究，我们证明，基于我们质量导向子集预训练的模型，在图像到3D生成任务中比基于Objaverse较大数据集训练的模型表现更好。此外，通过比较由我们标签筛选的不同训练数据子集，我们的结果显示，数据质量越高，训练损失收敛速度越快。这些发现表明，仔细筛选和丰富的注解可以弥补原始数据集规模的不足，可能提供一条更高效的3D生成模型开发路径。我们发布了大约包含50万个精心筛选的3D模型的增强数据集，以促进3D计算机视觉各种下游任务的研究。在未来，我们计划将注解扩展至整个Objaverse数据集。