LLM2D
基于局部解释的战略学习
Strategic Learning with Local Explanations as Feedback
作者: Kiet Q. H. Vo, Siu Lun Chau, Masahiro Kato, Yixin Wang, Krikamol Muandet
发布日期: 2/7/2025
arXiv ID: oai:arXiv.org:2502.04058v1

摘要

arXiv:2502.04058v1 宣告类型: 新 摘要: 我们研究了代理人可以战略性地响应决策制定者 (DM) 模型的算法决策问题。决策制定者 (DM) 对 (潜在的) 策略性代理人提供清晰和可操作的解释的需求正在持续上升。虽然先前的研究通常将解释视为完整模型的披露,但在实践中,解释可能仅传达部分信息,这可能导致代理人的误解和有害反应。当全面披露预测模型既不现实也不理想时,一个关键问题是,决策制定者如何通过使用解释来最大化自己的利益而不损害代理人福利。在本文中,我们探讨了广为人知的局部和全局解释方法,并确立了一个必要条件,以防止解释误导代理人为自损行为。此外,通过条件同质性,我们证明了基于行动推荐 (AR) 的解释对于非有害响应是充分的,类似于信息设计中的揭示原则。为了实施基于AR的解释,我们提出了一种简单的算法来同时优化预测模型和AR策略,以平衡决策制定者的收益与代理人的福利。我们的实证结果证明了这种方法作为在算法决策制定中更精细的策略,对安全和有效的部分模型披露的好处。