摘要
arXiv:2402.11005v3 替换-交叉
摘要:大规模语言模型(LLMs)越来越多地被用于自主决策,在这种情况下,它们会从庞大的动作空间中抽取选项。然而,指导这一抽样过程的启发式方法仍处于探索阶段。我们研究了这种抽样行为,并表明其中内在的启发式方法与人类决策过程相似,包含了描述性成分(反映统计规范)和处方性成分(蕴含在LLM中的隐含理想)。我们展示了这种样本从统计规范向处方性成分的偏差在公共健康、经济趋势等不同现实世界领域中的概念中始终保持一致。为了进一步阐明这一理论,我们证明LLM中的概念原型会受处方性规范的影响,类似于人类概念中的正常性。通过案例研究和与人类研究的比较,我们阐明,在实际应用中,LLM输出中样本向理想值的转变可能导致显著的偏差决策,引发伦理问题。