LLM2D

摘要

arXiv:2402.16063v4 生成类型：replace-cross 摘要：大型语言模型（LLMs）在各种场景中展现了强大的通用智能，包括将其集成到聊天机器人中。然而，基于LLM的聊天机器人的一个重要挑战是它们可能会在响应中生成虚构的内容，这极大地限制了它们的应用性。已经做出了各种努力来减轻虚构内容的问题，例如检索增强生成和基于人类反馈的强化学习，但其中许多方法需要额外的训练和数据标注。本文中，我们提出了一种新的后处理增强引用生成（CEG）方法，结合了检索论证。与之前专注于生成过程中防止虚构内容的研究不同，我们的方法以后处理的方式解决这一问题。它包含一个检索模块，用于搜索与生成内容相关的支持文档，并采用基于自然语言推理的引用生成模块。一旦生成内容中的声明缺乏参考，我们的模型可以重新生成响应，直到所有声明都有引用支持。需要注意的是，我们的方法是一个无需训练的即插即用插件，能够应用于各种LLM。在各种虚构内容相关的数据集上的实验表明，我们的框架在三个基准上的虚构内容检测和响应再生方面均优于当前最先进的方法。我们的代码和数据集将公开提供。