LLM2D

摘要

arXiv:2410.17500v2 宣告类型: 替换摘要: 不可分割资源的公平分配是一个基本问题。现有研究已经开发出了各种分配机制或算法，以满足不同的公平准则。例如，循环轮流制（RR）被提出以满足唯一好物的嫉妒自由（EF1）公平标准。专家在实际资源分配问题中使用算法而无需数学形式化，以找到用户优选的结果。因此，我们的目标是设计严格满足良好属性并复制专家知识的机制。然而，这个问题具有挑战性，因为这样的启发式规则往往难以进行数学形式化，使其难以整合到理论框架中。此外，形式化的算法难以找到优选的结果，直接复制这些隐式规则会导致不公平的分配，因为人的决策可能会引入偏见。在这篇论文中，我们旨在从示例中学习隐式的分配机制，同时严格遵守公平约束，特别是通过监督学习从报告的价值和隐式规则产生的相应分配结果示例中学习EF1分配机制。为了解决这个问题，我们开发了一种神经循环轮流制（NRR），这是一种新型的神经网络，参数化了循环轮流制。NRR基于RR的可微松弛版，并可以训练来学习用于RR的代理排序。我们进行了实验，通过示例学习EF1分配机制，结果显示我们的方法在预测分配的接近度和其他指标上优于基准方法。