LLM2D

摘要

arXiv:2402.11005v3 替换-交叉摘要：大规模语言模型（LLMs）越来越多地被用于自主决策，在这种情况下，它们会从庞大的动作空间中抽取选项。然而，指导这一抽样过程的启发式方法仍处于探索阶段。我们研究了这种抽样行为，并表明其中内在的启发式方法与人类决策过程相似，包含了描述性成分（反映统计规范）和处方性成分（蕴含在LLM中的隐含理想）。我们展示了这种样本从统计规范向处方性成分的偏差在公共健康、经济趋势等不同现实世界领域中的概念中始终保持一致。为了进一步阐明这一理论，我们证明LLM中的概念原型会受处方性规范的影响，类似于人类概念中的正常性。通过案例研究和与人类研究的比较，我们阐明，在实际应用中，LLM输出中样本向理想值的转变可能导致显著的偏差决策，引发伦理问题。