LLM2D

摘要

arXiv:2504.14325v1 通告类型: 新论文摘要: 让AI代理在多代理应用中互动增加了对AI结果可解释性和预测的复杂性，这对其在研究和社会中的可信应用产生了深远的影响。博弈论提供了强大的模型来捕捉和解释代理之间的战略互动，但仍需要可重现、标准化和用户友好的IT框架以使结果的比较和解释成为可能。为了解决这一问题，我们提出了FAIRGAME，一种基于博弈论的AI代理偏见识别框架。我们描述了其实施和使用方法，并利用它在流行的AI游戏中发现代理使用的大型语言模型（LLM）和使用的语言，以及代理的人格特质或战略知识引起的有偏见的结果。总的来说，FAIRGAME使用户能够可靠且轻松地模拟他们的游戏和场景，并在模拟战役之间以及与博弈论预测的结果进行比较，从而系统地发现偏见，预见战略性互动中出现的行为，并促进使用LLM代理的战略决策研究。