摘要
arXiv:2504.06868v1 声称类型: 交叉
摘要:人工代理在复杂交互和决策任务中越来越居于中心地位,然而将其行为与期望的人类价值观对齐仍然是一个开放的挑战。在此项工作中,我们研究了人类样式的个性特征如何影响代理在基于文本的交互环境中行为和性能。我们引入了PANDA(个性适应神经决策代理):一种将人类个性特征投影到代理上的新方法,以引导其行为。为了在基于文本的游戏代理中注入个性特征,我们采取了以下步骤:(i) 训练一个个性分类器来识别代理行为所体现的个性类型,(ii) 将个性档案直接整合进代理的策略学习管道中。通过对25个基于文本的游戏分配16种不同个性类型,并分析其轨迹,我们展示了代理的行为决策可以被引导朝向特定的个性特征。此外,某些个性类型,如开放性水平较高的类型,表现出明显的性能优势。这些发现强调了个性适应型代理在促进更具对齐性、更有效和以人为中心的决策方面的潜力。