LLM2D

摘要

arXiv:2504.08745v1 宣传类型: 多领域交叉摘要: 使用检索增强生成（RAG）进行个性化往往会忽略作者的细微特征，使得难以识别作者的独特特质。为了丰富RAG的上下文，我们提议除了提供作者过去的样本外，还向大型语言模型（LLMs）提供作者特定的特征，如平均情感极性和常用词汇。我们引入了一种新特征称为对比示例：检索其他作者的文档以帮助LLM识别作者的风格与其他人之间的独特之处。我们的实验表明，增加关于命名实体、依赖模式以及人们常用词汇的几句话，显著提高了个性化文本生成的效果。结合特征与对比示例进一步提升了性能，相对于基线RAG，取得了15%的相对改进，并且超过了基准测试。我们的结果展示了细微特征对于更好个性化的重要性，同时为将对比示例作为RAG的补充纳入研究开辟了一个新的研究方向。我们已公开发布我们的代码。