摘要
arXiv:2502.11843v1 宣告类型: cross
摘要: 大型语言模型(LLMs)广泛用作对话代理,在教育、法律、医学等领域中发挥其各种能力。然而,LLMs 经常表现出上下文切换行为,导致缺乏一致性和可解释的个性一致交互。对于心理特质的坚持性分析较少,特别是在双人对话(成对)情况下。我们从两个不同角度探讨了这一挑战,首先使用两个对话代理生成一个特定主题的讨论,赋予每个特质(开放性、尽责性、外向性、宜人性和神经质)高/低级别。随后使用多个评判代理来推断原始赋予的特质,以探索预测一致性、模型间的一致性以及与赋予个性的对齐。我们的研究结果表明,虽然LLMs可以被引导进行以个性为导向的对话,但它们维持个性特质的能力在不同的模型组合和讨论设置下存在显著差异。这些不一致性突显了在LLMs中实现稳定和可解释的个性一致交互所面临的挑战。