摘要
arXiv:2410.01871v2 宣告类型:替换交叉
摘要:在“快速行动与打破规则”的时代,监管机构未能迅速应对因故障的人工智能(AI)部署而留下的安全、偏见和法律问题碎片。尽管关于如何解决最先进的AI模型的安全性、偏见和法律问题进行了大量合乎情理的讨论,但缺乏严格的和现实的数学框架来监管AI。我们的论文应对了这一挑战,提出了一种基于拍卖的监管机制,该机制可证明激励设备(i)部署合规模型和(ii)参与监管过程。我们将AI监管形式化为一个全额支付拍卖,企业提交模型以获得批准。监管机构实施合规门槛,并进一步奖励那些表现出比其同行更高合规度的模型。我们推导出纳什均衡,表明理性的行为人将提交超出规定合规门槛的模型。实证结果显示,与基础监管机制相比,我们的监管拍卖将合规率提高了20%,参与率提高了15%,并且优于仅施加最低合规标准的更简单的框架。