LLM2D

摘要

arXiv:2502.08597v1 交叉类型摘要：我们分析了在具有随机收益的资产市场中异质学习代理的表现。这些代理的目标是最大化其财富的预期增长率，但对如何做到这一点有不同的理论。我们重点关注比较贝叶斯学习者和无遗憾学习者在市场动态中的表现。具有正先验概率的有限模型集合上先验的贝叶斯学习者，在后验概率上以指数形式收敛到正确的模型。因此，即使存在根据正确过程模型进行投资的代理，它们也能生存下来。具有连续先验的贝叶斯学习者以 $O((\log T)/T)$ 的速率收敛到正确的模型。在线学习理论为在这种情况下最大化财富的对数提供了无遗憾算法，无需假设稳定的背景随机过程，且相对于最佳固定投资规则实现了最坏情况遗憾界为 $O(\log T)$。正如我们观察到的，这种遗憾与具有连续先验的贝叶斯学习者的遗憾量级相同。然而，我们证明了即使如此低的遗憾也可能不足以在资产市场上生存：一个代理可以拥有 $O(\log T)$ 的遗憾，但在与根据正确模型进行投资的代理或甚至与具有有限先验的完美贝叶斯学习者竞争时，仍然可能在市场动态中消失。另一方面，我们证明了贝叶斯学习是脆弱的，而无遗憾学习需要较少的环境知识，因此更加稳健。任何无遗憾学习者都会驱逐出市场一个不完美的贝叶斯学习者，后者的有限先验或更新规则甚至有小错误。我们正式建立了经济学中研究的生存、消失和市场主导概念与遗憾最小化框架之间的关系，从而将这些理论联系起来。