摘要
arXiv:2502.07280v1 交叉公告类型:cross
摘要:深度强化学习(DRL)已在金融投资组合管理中得到应用,以在不断变化的市场条件下提高回报。然而,与DRL在大多数广泛使用领域不同,股票市场由于受到全球经济事件和投资者情绪等多种因素的影响,更加波动和动态。因此,构建一个能够提供强大回报能力、训练稳定性和泛化能力的基于DRL的投资组合管理框架仍然是一项挑战。本研究提出了一种新的框架,利用了Memory Instance Gated Transformer(MIGT)来实现有效的投资组合管理。通过结合一种变体的变压器、实例标准化和Lite Gate单元,我们的方法旨在最大化投资回报,同时确保学习过程的稳定性并减少异常值的影响。在道琼斯工业平均指数30种股票上进行测试,我们的框架使用累积回报和风险收益比(夏普比率、索特诺比率和欧米伽比率等关键金融指标)与其他十五种策略进行了比较。结果突显了MIGT的优势,展示了与竞争策略相比至少9.75%的累计回报改进和最小2.36%的风险收益比提升,标志着在投资组合管理中基于DRL的一个重要进展。