摘要
arXiv:2404.04351v2 公告类型: 替换-交叉 摘要: 生成式大型语言模型能够在知识领域之间进行高效的分析,在信息比较方面与人类专家相媲美。然而,由于在大上下文中维护信息和克服模型令牌限制的困难,LLM在信息比较方面的应用面临可扩展性挑战。为了应对这些挑战,我们开发了新颖的摘要生成与标准驱动的比较端点(ASC$^2$End)系统,以实现大规模的信息比较自动化。我们的系统采用语义文本相似性比较来生成证据支持的分析。我们利用经过验证的数据处理策略,如摘要生成和检索增强生成,以克服令牌限制并在模型推理期间保留相关信息。提示设计采用了零样本策略,以更好地为模型推理提供信息上下文。我们使用ROUGE评分评估摘要生成,并通过调查反馈评估生成的比较质量。在ASC$^2$End系统上评估的模型显示出理想的结果,提供了系统预期性能的见解。ASC$^2$End是一个新颖的系统与工具,能够在知识领域之间实现准确、自动化的信息比较,克服上下文长度和检索的限制。