摘要
arXiv:2502.02966v1 宣告类型:交叉
摘要:我们提出了一种名为FACTER的公平性 Awareness框架,该框架将形式化预测与动态提示工程相结合,用于基于LLM的推荐系统。通过引入自适应语义方差阈值和违规触发机制,每当出现有偏模式时,FACTER会自动收紧公平性约束。我们进一步开发了一种对抗性提示生成器,该生成器利用历史违规情况来减少重复的demographic偏见,而无需重新训练LLM。在MovieLens和Amazon上的实验证明,FACTER在显著减少公平性违规(最高达95.5%)的同时,保持了强大的推荐准确性,揭示了语义方差是偏见的一种有力代理指标。