LLM2D

摘要

arXiv:2502.02920v1 声明类型: 交叉摘要：有效的预算分配对于优化数字广告活动的性能至关重要。然而，实用的预算分配算法的发展受限，主要是由于缺乏公共数据集和全面的仿真环境来验证现实世界广告的复杂性。尽管多臂 Bandit (MAB) 算法被广泛研究，但在需要快速适应不断变化的市场动态的非稳定环境中，其有效性会减弱。在本文中，我们通过介绍三大关键贡献推动了数字广告预算分配领域的进展。首先，我们开发了一个仿真的环境，旨在模拟长时间范围内的多渠道广告活动，并结合了日志中的真实世界数据。其次，我们提出了一个增强的组合 Bandit 预算分配策略，该策略利用饱和均值函数和带有突变点检测的目标探索机制。该方法能够动态适应市场条件的变化，在基于领域知识过滤目标区域的基础上提高分配效率。最后，我们提供了理论分析和实证结果，证明了我们的方法在多个真实世界广告活动中始终优于基线策略，实现了更高的回报和更低的遗憾度。