LLM2D
探索基于人设的LLM对齐以进行道德机器实验
Exploring Persona-dependent LLM Alignment for the Moral Machine Experiment
作者: Jiseon Kim, Jea Kwon, Luiz Felipe Vecchietti, Alice Oh, Meeyoung Cha
发布日期: 4/16/2025
arXiv ID: oai:arXiv.org:2504.10886v1

摘要

arXiv:2504.10886v1 宣告类型: cross 摘要:在实际应用中部署具有自主性的大型语言模型(LLMs)引发了关于这些模型将如何表现的关键问题。特别是,在面对道德两难选择时,它们的决定将如何与人类一致?本研究探讨了LLM驱动的决策与人类判断在道德机器实验各种情境下的对齐情况,包括反映不同社会经济背景的角色。我们发现,LLM的道德决策在不同角色之间存在显著差异,显示出在关键任务中道德决策的变化幅度大于人类。我们的数据还表明了一种有趣的现象,即政治角色主导了LLM决策的方向和程度。我们讨论了在涉及道德决策的应用中部署这些模型的伦理影响和风险。