LLM2D

摘要

本文介绍了一种新方法，称为“哈希法”，该方法通过用类似哈希的无意义标识符屏蔽大型语言模型 (LLM) 中可能诱导偏差的词语来减少认知偏差和对外部知识的依赖。该方法在三个实验集中进行了测试，共涉及 490 个提示。使用卡方检验的统计分析表明，在所有测试场景中都有显著改进，这些场景涵盖了 LLama、ChatGPT、Copilot、Gemini 和 Mixtral 模型。在第一个实验中，哈希法降低了修改版“琳达问题”（旨在评估对认知偏差的敏感性）中的谬误率。在第二个实验中，它提高了 LLM 在频繁项集提取任务中的结果。在第三个实验中，我们发现即使将“琳达问题”以表格形式而不是文本形式呈现，哈希法仍然有效，这表明该技术适用于各种输入表示。总的来说，该方法被证明可以提高偏差减少和外部知识的整合。尽管减少了偏差，但在不同类型的 LLM 模型中，幻觉率却并不一致地降低。这些发现表明，屏蔽诱导偏差的术语可以提高 LLM 的性能，尽管其有效性取决于模型和任务。