摘要
arXiv:2504.05711v1 公告类型: 新
摘要: 遵守存档标准需要专门的知识,而手动为存档材料创建元数据描述既乏味又容易出错。本文旨在探索自主人工智能和大型语言模型(LLMs)在实施标准化存档描述流程中的潜在应用。为此,我们介绍了一个基于自主人工智能的系统,用于自动生成高质量的存档材料元数据描述。我们开发了一种联邦优化方法,将多个LLM的智能联合起来构建最优的存档元数据。我们还提出了一种方法,以克服使用LLM实现一致元数据生成所面临的挑战。为了评估我们技术的可行性和有效性,我们在一个涵盖各种文档类型和数据格式的真实数据集上进行了广泛的实验。评估结果表明了我们技术的可行性,并突显了与单模型解决方案相比,联邦优化方法在元数据质量和可靠性方面的优越性能。