LLM2D
近最优私有学习在线性上下文bandits中
Near-Optimal Private Learning in Linear Contextual Bandits
作者: Fan Chen, Jiachun Li, Alexander Rakhlin, David Simchi-Levi
发布日期: 2/19/2025
arXiv ID: oai:arXiv.org:2502.13115v1

摘要

arXiv:2502.13115v1 私人学习类型: 交叉 摘要: 我们分析了广义线性上下文臂拉伯问题中的私人学习问题。我们的方法基于一种新颖的加权回归方法,从而得到了在联合隐私模型和局部隐私模型中分别具有$\sqrt{T}+\frac{1}{\alpha}$和$\frac{\sqrt{T}}{\alpha}$遗憾损失的有效算法。此外,我们提供了近乎最优的私有程序,这些程序在私人线性模型和线性上下文臂拉伯问题中实现了维数无关的速度。特别是,我们的结果表明,在我们考虑的所有设置中,联合隐私几乎“免费”,部分解决了Azize和Basu(2024)提出的一个开放问题。