LLM2D
快一点还是更好?在灵活用户控制下的检索增强生成中平衡准确性和成本
Fast or Better? Balancing Accuracy and Cost in Retrieval-Augmented Generation with Flexible User Control
作者: Jinyan Su, Jennifer Healey, Preslav Nakov, Claire Cardie
发布日期: 2/18/2025
arXiv ID: oai:arXiv.org:2502.12145v1

摘要

arXiv:2502.12145v1 宣传类型:交叉 摘要:检索增强生成(RAG)作为一种通过融入外部知识检索来缓解大型语言模型(LLM)幻觉的强大方法已经出现。然而,现有的RAG框架往往不分青红皂白地应用检索,导致不必要的过度检索或在需要进行复杂推理时无法迭代检索。尽管最近的自适应检索策略能够自适应地导航这些检索策略,但它们仅基于查询复杂性进行预测,缺乏用户驱动的灵活性,因此无法满足多样化的用户应用需求。在本文中,我们提出了一种新颖的用户可控的RAG框架,使得能够动态调整准确性和成本之间的权衡。我们的方法利用了两个分类器:一个用于优先考虑准确性,另一个用于优先考虑检索效率。通过可解释的控制参数 $\alpha$,用户可以根据其特定需求在最小成本检索和高准确度检索之间无缝切换。我们实证演示了我们的方法有效地平衡了准确率、检索成本和用户可控性,使其成为面向实际应用场景的实用且可适应的解决方案。