LLM2D

摘要

arXiv:2502.05720v1 宣告类型: cross 摘要: 最大值搜索是在线决策中的一个经典问题，其中交易者根据一系列揭示的价格采取行动，并不可撤销地接受其中一个以最大化其利润。该问题已在概率性和最坏情况下的不同设置中进行了研究，特别是通过竞争力分析，并且最近在交易者可以访问序列预测的学习增强设置中进行了研究。然而，现有的方法要么缺乏平滑性，要么不能实现最优的最坏情况保证：它们未能在算法的一致性和鲁棒性之间取得最佳可能的权衡。我们通过呈现首个同时实现这两个重要目标的算法来弥补这一差距。此外，我们展示了如何利用获得的平滑性来分析随机学习增强设置下的最大值搜索，这种设置捕获了观察到的价格和预测中的随机性。