LLM2D
利用作者特征和对比例子改进RAG的个性化能力
Improving RAG for Personalization with Author Features and Contrastive Examples
作者: Mert Yazan, Suzan Verberne, Frederik Situmeang
发布日期: 4/15/2025
arXiv ID: oai:arXiv.org:2504.08745v1

摘要

arXiv:2504.08745v1 宣传类型: 多领域交叉 摘要: 使用检索增强生成(RAG)进行个性化往往会忽略作者的细微特征,使得难以识别作者的独特特质。为了丰富RAG的上下文,我们提议除了提供作者过去的样本外,还向大型语言模型(LLMs)提供作者特定的特征,如平均情感极性和常用词汇。我们引入了一种新特征称为对比示例:检索其他作者的文档以帮助LLM识别作者的风格与其他人之间的独特之处。我们的实验表明,增加关于命名实体、依赖模式以及人们常用词汇的几句话,显著提高了个性化文本生成的效果。结合特征与对比示例进一步提升了性能,相对于基线RAG,取得了15%的相对改进,并且超过了基准测试。我们的结果展示了细微特征对于更好个性化的重要性,同时为将对比示例作为RAG的补充纳入研究开辟了一个新的研究方向。我们已公开发布我们的代码。