LLM2D
Objaverse++:质量标注的 curated 3D 对象数据集
Objaverse++: Curated 3D Object Dataset with Quality Annotations
作者: Chendi Lin, Heshan Liu, Qunshu Lin, Zachary Bright, Shitao Tang, Yihui He, Minghao Liu, Ling Zhu, Cindy Le
发布日期: 4/15/2025
arXiv ID: oai:arXiv.org:2504.07334v2

摘要

arXiv:2504.07334v2 宣告类型: 替换-交叉 摘要: 本文介绍了Objaverse++,这是一份由人类专家增加详细属性注解的Objaverse精选子集。3D内容生成的最近进展得益于大规模数据集,如Objaverse,其中包含来自互联网的超过80万的3D对象。尽管Objaverse代表了最大的可用3D资产集合,但其用途受限于低质量模型的主导地位。为解决这一限制,我们手动为10,000个3D对象加上了详细的属性注解,包括美学质量评分、纹理颜色分类、多对象组合标志、透明度特性等。然后,我们训练了一个能够为Objaverse数据集中的其余部分进行注解的神经网络。通过实验和生成结果的用户研究,我们证明,基于我们质量导向子集预训练的模型,在图像到3D生成任务中比基于Objaverse较大数据集训练的模型表现更好。此外,通过比较由我们标签筛选的不同训练数据子集,我们的结果显示,数据质量越高,训练损失收敛速度越快。这些发现表明,仔细筛选和丰富的注解可以弥补原始数据集规模的不足,可能提供一条更高效的3D生成模型开发路径。我们发布了大约包含50万个精心筛选的3D模型的增强数据集,以促进3D计算机视觉各种下游任务的研究。在未来,我们计划将注解扩展至整个Objaverse数据集。