摘要
本文介绍了一种新方法,称为“哈希法”,该方法通过用类似哈希的无意义标识符屏蔽大型语言模型 (LLM) 中可能诱导偏差的词语来减少认知偏差和对外部知识的依赖。该方法在三个实验集中进行了测试,共涉及 490 个提示。使用卡方检验的统计分析表明,在所有测试场景中都有显著改进,这些场景涵盖了 LLama、ChatGPT、Copilot、Gemini 和 Mixtral 模型。在第一个实验中,哈希法降低了修改版“琳达问题”(旨在评估对认知偏差的敏感性)中的谬误率。在第二个实验中,它提高了 LLM 在频繁项集提取任务中的结果。在第三个实验中,我们发现即使将“琳达问题”以表格形式而不是文本形式呈现,哈希法仍然有效,这表明该技术适用于各种输入表示。总的来说,该方法被证明可以提高偏差减少和外部知识的整合。尽管减少了偏差,但在不同类型的 LLM 模型中,幻觉率却并不一致地降低。这些发现表明,屏蔽诱导偏差的术语可以提高 LLM 的性能,尽管其有效性取决于模型和任务。