LLM2D

摘要

arXiv:2504.02880v1 交叉刊物类型: cross 摘要: 开发基于计算机视觉的水稻表型技术对于精准田间管理、加快育种并持续提升水稻产量至关重要。在表型任务中，区分图像组件是描述器官尺度的植物生长和发育的关键前提，有助于更深入地了解生态生理过程。然而，由于水稻器官的细微结构和林冠内的复杂照明，这项任务仍然极具挑战性，强调了高质量训练数据集的必要性。这类数据集稀缺，主要原因在于缺乏大型、代表性的水稻田图像集合，以及注释过程的繁琐性。为解决这一问题，我们建立了首个全面的多类水稻语义分割数据集——RiceSEG。我们从五个主要水稻种植国家（中国、日本、印度、菲律宾和坦桑尼亚）收集了近50,000张高分辨率、地基的图像，涵盖了超过6,000种基因型的所有生长阶段。从这些原始图像中选择了3,078个代表性样本，并按六个类别（背景、绿色植被、衰老植被、稻穗、杂草和水葫芦）进行注释，形成了RiceSEG数据集。值得注意的是，来自中国的子数据集涵盖了从东北到南部的所有主要基因型和水稻种植环境。使用当前最先进的卷积神经网络和基于变换器的语义分割模型作为基线。虽然这些模型在分割背景和绿色植被方面表现得相当好，但在生殖阶段时，当林冠结构更复杂且涉及多个类别时，它们会遇到困难。这些发现突显了我们数据集对开发专门用于水稻及其他作物的分割模型的重要性。