LLM2D

摘要

arXiv:2410.01871v2 宣告类型：替换交叉摘要：在“快速行动与打破规则”的时代，监管机构未能迅速应对因故障的人工智能（AI）部署而留下的安全、偏见和法律问题碎片。尽管关于如何解决最先进的AI模型的安全性、偏见和法律问题进行了大量合乎情理的讨论，但缺乏严格的和现实的数学框架来监管AI。我们的论文应对了这一挑战，提出了一种基于拍卖的监管机制，该机制可证明激励设备（i）部署合规模型和（ii）参与监管过程。我们将AI监管形式化为一个全额支付拍卖，企业提交模型以获得批准。监管机构实施合规门槛，并进一步奖励那些表现出比其同行更高合规度的模型。我们推导出纳什均衡，表明理性的行为人将提交超出规定合规门槛的模型。实证结果显示，与基础监管机制相比，我们的监管拍卖将合规率提高了20%，参与率提高了15%，并且优于仅施加最低合规标准的更简单的框架。