摘要
arXiv:2504.14325v2 宣告类型: 替换
摘要:在多智能体应用中让AI代理相互作用增加了对AI结果可解释性和预测的复杂性,这对其在研究和社會中的可靠采用产生了深远的影响。博弈论提供了强大的模型来捕捉和解释代理之间的战略性交互,但需要支持可重复、标准且用户友好的IT框架,以便进行结果的比较和解释。为此,我们提出了FAIRGAME,一个基于博弈论的AI代理偏差识别框架。我们描述了其实现和使用方法,并利用它在流行的基于AI代理的游戏中发现了偏差结果,这取决于所使用的大型语言模型(LLM)和所使用的语言,以及代理的个性特征或战略知识。总体而言,FAIRGAME使用户能够可靠且容易地模拟他们想要的游戏和场景,并在仿真活动中比较结果与博弈论预测进行对比,从而系统地发现偏差,预见由战略相互作用产生的新兴行为,并增强对使用LLM代理的战略决策研究。