LLM2D
RAPTOR:改进的产品表对象识别方法
RAPTOR: Refined Approach for Product Table Object Recognition
作者: Eliott Thomas, Mickael Coustaty, Aurelie Joseph, Elodie Carel, Vincent Poulain D'Andecy, Jean-Marc Ogier
发布日期: 2/24/2025
arXiv ID: oai:arXiv.org:2502.14918v1

摘要

arXiv:2502.14918v1 类型:交叉 摘要:从文档中提取表格是一项在各个行业中至关重要的任务,尤其是在发票和报告这类商业文档中。现有的基于DEtection TRansformer(DETR)系统,如TAble TRansformer(TATR),提供了表格检测(TD)和表格结构识别(TSR)的解决方案,但面对多样化的表格格式和常见的错误,如检测错误区域和重叠列的问题时仍然存在挑战。这项研究介绍了一种名为RAPTOR的模块化后处理系统,旨在增强最先进的模型,以提高表格提取的效果,尤其是对于产品表格。RAPTOR解决了表格检测和表格结构识别的反复出现的问题,提高了精度和结构预测的准确性。对于表格检测(TD),我们使用了在ICDAR 2019上训练的DETR和在PubTables-1M和FinTabNet上训练的TATR;而对于表格结构识别(TSR)仅依赖于TATR。我们将遗传算法纳入其中,通过一个私有的产品表格数据集优化RAPTOR的模块参数,以满足工业需求。我们在两个私有的产品表格数据集上评估了该方法,这些数据集包括与我们目标产品表格类似的内容,以及ICDAR 2013和ICDAR 2019数据集。结果表明,在产品表格方面,我们的方法表现出色,同时在各种表格格式中也保持了合理的性能。进一步的消融研究还验证了我们系统中每个模块的贡献。