LLM2D

摘要

arXiv:2504.07334v1 宣布类型: cross 摘要: 本文介绍了Objaverse++，这是Objaverse的一个精心挑选的子集，该子集增加了由人类专家提供的详细属性注释。大规模3D内容生成的最近进展得益于类似Objaverse这样的大型数据集，Objaverse包含超过80万个从互联网收集的3D对象。尽管Objaverse代表了目前可用的最大3D资产集合，但由于其主要包含低质量模型，其实用性受到限制。为了解决这一限制，我们手动为10,000个3D对象添加了详细的属性注释，包括美学质量评分、纹理颜色分类、多对象组合标志、透明度特性等。然后，我们训练了一个能够为Objaverse数据集其余部分标注标签的神经网络。通过实验和生成结果的用户研究，我们证明了在我们质量导向子集上预训练的模型在图像到3D生成任务中比在Objaverse的大数据集上训练的模型表现更好。此外，通过对我们的标签过滤后的多个数据子集进行比较，我们的结果显示，数据质量越高，训练损失收敛得越快。这些发现表明，仔细的整理和丰富的注释可以弥补原始数据集规模不足的问题，这可能会提供一种更高效的路径来开发3D生成模型。我们发布了包含约50万个精心挑选的3D模型的增强数据集，以促进在3D计算机视觉下游任务方面的进一步研究。在未来，我们计划将注释扩展到整个Objaverse数据集。