LLM2D
噪声特征下的上下文线性老虎机:迈向贝叶斯先知
Contextual Linear Bandits under Noisy Features: Towards Bayesian Oracles
作者: Jung-hun Kim, Se-Young Yun, Minchan Jeong, Jun Hyun Nam, Jinwoo Shin, Richard Combes
发布日期: 10/11/2024
arXiv ID: oai:arXiv.org:1703.01347v4

摘要

我们研究了特征不确定的情境线性老虎机问题,其中特征存在噪声且存在缺失条目。为了应对这种噪声带来的挑战,我们分析了基于观察到的噪声特征的贝叶斯先验。我们的贝叶斯分析表明,最优假设可能会显著偏离潜在的可实现函数,这取决于噪声特征。这些偏差非常不直观,在经典的无噪声设置中不会发生。这意味着经典方法无法保证非平凡的遗憾界。因此,我们提出了一种算法,旨在根据该模型下的观察信息近似贝叶斯先验,在存在大量臂的情况下实现了 $\tilde{O}(d\sqrt{T})$ 遗憾界。我们使用合成数据集和真实数据集演示了所提出的算法。