LLM2D
长文档自动摘要
Automatic Summarization of Long Documents
作者: Naman Chhibbar, Jugal Kalita
发布日期: 10/10/2024
arXiv ID: oai:arXiv.org:2410.05903v1

摘要

每天都有大量文本数据被添加到互联网上,这使得利用和解读这些数据变得困难和繁琐。因此,自动文本摘要对于提取相关信息、节省宝贵的阅读时间至关重要。虽然许多基于 Transformer 的模型在摘要方面表现出色,但它们的输入大小受到限制,无法处理超过其上下文大小的文本。本研究提出了三种新颖的算法,允许任何 LLM 有效地克服其输入大小的限制,在没有任何架构修改的情况下有效地利用其全部潜力。我们在超过 70,000 个单词的文本上测试了我们的算法,实验结果表明 BERTScore 显着提高,ROUGE 分数具有竞争力。