LLM2D
FAIRGAME:一种基于博弈论的AI代理偏见识别框架
FAIRGAME: a Framework for AI Agents Bias Recognition using Game Theory
作者: Alessio Buscemi, Daniele Proverbio, Alessandro Di Stefano, The Anh Han, German Castignani, Pietro Di Li\`o
发布日期: 4/22/2025
arXiv ID: oai:arXiv.org:2504.14325v1

摘要

arXiv:2504.14325v1 通告类型: 新论文 摘要: 让AI代理在多代理应用中互动增加了对AI结果可解释性和预测的复杂性,这对其在研究和社会中的可信应用产生了深远的影响。博弈论提供了强大的模型来捕捉和解释代理之间的战略互动,但仍需要可重现、标准化和用户友好的IT框架以使结果的比较和解释成为可能。为了解决这一问题,我们提出了FAIRGAME,一种基于博弈论的AI代理偏见识别框架。我们描述了其实施和使用方法,并利用它在流行的AI游戏中发现代理使用的大型语言模型(LLM)和使用的语言,以及代理的人格特质或战略知识引起的有偏见的结果。总的来说,FAIRGAME使用户能够可靠且轻松地模拟他们的游戏和场景,并在模拟战役之间以及与博弈论预测的结果进行比较,从而系统地发现偏见,预见战略性互动中出现的行为,并促进使用LLM代理的战略决策研究。