LLM2D

摘要

arXiv:2403.08222v2 通知类型: replace-cross 摘要: 在存在诚实专家和恶意专家的情况下，我们考虑了稳健的聚合问题。诚实专家将如实报告他们的私人信号，而恶意专家则可以任意报告。我们假设专家在边缘对称的意义上是相同的，即他们共享同样的先验概率和边际后验概率。规则制定者需要设计一个聚合器，从这些专家的报告中预测真实的世界状态，而不了解底层信息结构或恶意策略。我们的目标是在最糟糕的信息结构和恶意策略下找到一个最优的聚合器，该聚合器输出的预测能够最小化遗憾。遗憾定义为该聚合器的预期损失与给定信息结构和诚实专家报告的最优聚合者之间的预期损失差值。我们关注二元状态和报告。在L1损失下，我们证明截断均值聚合器是最佳的。当最多有k个恶意者时，聚合器舍弃最低和最高的k个报告值，并对剩余值求平均。对于L2损失，最优聚合器是分段线性函数。当恶意者的比例受专家的先验和后验确定的某个值以上限制时，所有最优性都成立。遗憾只取决于恶意者的比例，而与恶意者的总数量无关。对于输出决策的硬聚合器，我们证明在L1和L2下，随机版本的截断均值聚合器是最佳的。这种聚合器在舍弃最低和最高的k个报告值后，随机跟随剩余的一个值。我们将硬聚合器推广到多状态设置。我们在集成学习任务中数值评估了我们的聚合器。我们在更广泛的信息结构和报告空间下的普遍恶意聚合问题上也得到了一些负面结果。