LLM2D
手写文本识别:一个综述
Handwritten Text Recognition: A Survey
作者: Carlos Garrido-Munoz, Antonio Rios-Vila, Jorge Calvo-Zaragoza
发布日期: 2/13/2025
arXiv ID: oai:arXiv.org:2502.08417v1

摘要

arXiv:2502.08417v1 交叉类型: cross 摘要: 手写文本识别(HTR)已成为模式识别和机器学习中的一个重要领域,其应用范围从历史文档保护到现代数据录入和无障碍解决方案。手写文本识别的复杂性在于手写的高度变异性,这使其开发稳健的识别系统颇具挑战性。本文综述了手写文本识别模型的发展演变,从早期基于启发式的方法到当前最先进的神经网络模型,这些模型利用了深度学习技术。该领域的范围也有所扩展,从最初只能识别单词水平的内容,到最近的端到端文档级别的方法。我们的论文将现有工作按两种主要的识别层次进行分类:(1) \emph{到行级},包括单词和行的识别;(2) \emph{超出行级},解决段落级和文档级的挑战。我们提供了一个统一的框架,该框架涵盖了研究方法、最新的基准测试进展、该领域的关键数据集,以及对文献中报告结果的讨论。最后,我们明确了亟待解决的研究挑战,并概述了有希望的未来方向,旨在为研究人员和从业人员提供一个推动该领域发展的路线图。