LLM2D
电子学位论文章节级自动分类
Automating Chapter-Level Classification for Electronic Theses and Dissertations
作者: Bipasha Banerjee, William A. Ingram, Edward A. Fox
发布日期: 11/27/2024
arXiv ID: oai:arXiv.org:2411.17614v1

摘要

传统的电子学位论文(ETD)存档实践依赖于宽泛的高级元数据方案,这些方案无法捕捉到这些冗长学术作品的深度、复杂性和跨学科性质。缺乏详细的章节级内容描述阻碍了研究人员查找特定章节或主题的能力,从而降低了可发现性和整体可访问性。通过提供章节级元数据信息,我们提高了ETD作为研究资源的有效性。这使得学者更容易高效地浏览它们并提取有价值的见解。此类元数据的缺失进一步阻碍了跨学科研究,掩盖了各个领域之间的联系,阻碍了新的学术发现和合作。在本文中,我们提出了一种机器学习和人工智能驱动的解决方案,用于自动对ETD章节进行分类。该解决方案旨在提高可发现性并促进对章节的理解。我们的方法通过提供丰富的上下文描述来丰富传统的存档实践,从而促进有针对性的导航和改进访问。我们的目标是支持跨学科研究,并使ETD更容易访问。通过提供章节级分类标签并在我们开发的原型系统中使用它们进行索引,我们使ETD章节中的内容更易于发现,并可用于各种学术需求。实施这种人工智能增强的方法允许档案馆更好地为研究人员服务,从而能够高效地访问相关信息并支持更深入地参与ETD。这将提高ETD作为研究工具的影响力,促进跨学科探索,并加强档案馆在数据密集型学术环境中在学术交流中的作用。