摘要
在越来越多的领域,人工智能 (AI) 系统不仅超越了人类的能力,而且准确地模拟了人类的行为。这为通过更具相关性的 AI 合作伙伴以及对人类决策的更深入洞察,在这些领域实现算法驱动的教学带来了可能性。然而,实现这一目标的关键在于连贯地建模不同技能水平的人类行为。国际象棋是一个理想的模型系统,可以进行此类人类-AI 对齐研究,它拥有作为 AI 研究的关键测试平台的丰富历史、像 AlphaZero 这样的成熟的超人类 AI 系统,以及通过国际象棋评级系统对技能进行精确测量。以前在建模国际象棋中的人类决策方面的工作使用完全独立的模型来捕获不同技能水平的人类风格,这意味着它们在适应人类改进的整个范围方面的能力缺乏连贯性,最终限制了它们作为 AI 合作伙伴和教学工具的有效性。在这项工作中,我们提出了一种统一的建模方法,用于国际象棋中的人类-AI 对齐,该方法连贯地捕获了不同技能水平的人类风格,并直接捕获了人们如何提高。认识到人类学习的复杂非线性性质,我们引入了一种技能感知注意力机制,以动态地将玩家的优势与编码的国际象棋位置集成,使我们的模型能够对不断发展的玩家技能敏感。我们的实验结果表明,这种统一框架显着增强了 AI 与人类玩家在各种专业水平上的对齐,为更深入地洞察人类决策和 AI 指导的教学工具铺平了道路。