LLM2D
Objaverse++: 精选高质量注解的3D对象数据集
Objaverse++: Curated 3D Object Dataset with Quality Annotations
作者: Chendi Lin, Heshan Liu, Qunshu Lin, Zachary Bright, Shitao Tang, Yihui He, Minghao Liu, Ling Zhu, Cindy Le
发布日期: 4/11/2025
arXiv ID: oai:arXiv.org:2504.07334v1

摘要

arXiv:2504.07334v1 宣布类型: cross 摘要: 本文介绍了Objaverse++,这是Objaverse的一个精心挑选的子集,该子集增加了由人类专家提供的详细属性注释。大规模3D内容生成的最近进展得益于类似Objaverse这样的大型数据集,Objaverse包含超过80万个从互联网收集的3D对象。尽管Objaverse代表了目前可用的最大3D资产集合,但由于其主要包含低质量模型,其实用性受到限制。为了解决这一限制,我们手动为10,000个3D对象添加了详细的属性注释,包括美学质量评分、纹理颜色分类、多对象组合标志、透明度特性等。然后,我们训练了一个能够为Objaverse数据集其余部分标注标签的神经网络。通过实验和生成结果的用户研究,我们证明了在我们质量导向子集上预训练的模型在图像到3D生成任务中比在Objaverse的大数据集上训练的模型表现更好。此外,通过对我们的标签过滤后的多个数据子集进行比较,我们的结果显示,数据质量越高,训练损失收敛得越快。这些发现表明,仔细的整理和丰富的注释可以弥补原始数据集规模不足的问题,这可能会提供一种更高效的路径来开发3D生成模型。我们发布了包含约50万个精心挑选的3D模型的增强数据集,以促进在3D计算机视觉下游任务方面的进一步研究。在未来,我们计划将注释扩展到整个Objaverse数据集。