LLM2D

摘要

arXiv:2502.07280v1 交叉公告类型：cross 摘要：深度强化学习（DRL）已在金融投资组合管理中得到应用，以在不断变化的市场条件下提高回报。然而，与DRL在大多数广泛使用领域不同，股票市场由于受到全球经济事件和投资者情绪等多种因素的影响，更加波动和动态。因此，构建一个能够提供强大回报能力、训练稳定性和泛化能力的基于DRL的投资组合管理框架仍然是一项挑战。本研究提出了一种新的框架，利用了Memory Instance Gated Transformer（MIGT）来实现有效的投资组合管理。通过结合一种变体的变压器、实例标准化和Lite Gate单元，我们的方法旨在最大化投资回报，同时确保学习过程的稳定性并减少异常值的影响。在道琼斯工业平均指数30种股票上进行测试，我们的框架使用累积回报和风险收益比（夏普比率、索特诺比率和欧米伽比率等关键金融指标）与其他十五种策略进行了比较。结果突显了MIGT的优势，展示了与竞争策略相比至少9.75%的累计回报改进和最小2.36%的风险收益比提升，标志着在投资组合管理中基于DRL的一个重要进展。