LLM2D
让历史易于阅读
Making History Readable
作者: Bipasha Banerjee, Jennifer Goyne, William A. Ingram
发布日期: 11/27/2024
arXiv ID: oai:arXiv.org:2411.17600v1

摘要

弗吉尼亚理工大学图书馆 (VTUL) 数字图书馆平台 (DLP) 托管着数字馆藏,为用户提供了访问各种具有历史和文化重要性的文献的途径。这些馆藏不仅具有学术意义,也让用户得以一窥当地历史事件。我们的 DLP 包含由具有复杂布局、褪色图像和难以阅读的手写文本的数字对象组成的馆藏,这使得向这些材料提供在线访问变得极具挑战性。为了解决这些问题,我们将 AI 集成到我们的 DLP 工作流程中,并将数字对象中的文本转换为机器可读格式。为了增强用户在我们历史馆藏中的体验,我们使用定制的 AI 代理进行手写识别、文本提取,以及使用大型语言模型 (LLM) 进行摘要。本海报重点介绍了三个馆藏,分别侧重于手写信件、报纸和数字化地形图。我们讨论了每个馆藏的挑战,并详细介绍了我们解决这些挑战的方法。我们提出的方法旨在通过使这些馆藏中的内容更容易搜索和浏览来增强用户体验。