LLM2D

摘要

arXiv:2502.05218v1 交叉类型: cross 摘要: 作为经济学和金融学中的基本方法，因子模型在定量投资中得到了广泛的应用。近年来，因子模型从传统由专家设计的线性模型转向了更具灵活性的基于数据驱动的非线性机器学习模型，旨在提高这些因子模型的效果。然而，由于市场数据中的低信噪比，数据驱动模型中挖掘有效的因子仍然是一个挑战。在这项工作中，我们提出了一种基于超图的时间残差对比学习因子模型(FactorGCL)，该模型利用超图结构更好地捕捉股票回报与因子之间的高阶非线性关系。为了发掘补充人类设计的先验因子的隐藏因子以预测股票回报，我们设计了一种级联残差超图架构，在该架构中，隐藏因子是从移除先验因子影响后的残差信息中提取出来的。此外，我们提出了一种时间残差对比学习方法，通过对比不同时间周期内股票特有的残差信息来指导有效且综合的隐藏因子的提取。在真实股票市场数据上的广泛实验表明，FactorGCL 不仅在现有最先进的方法中表现更优，还成功地挖掘出了用于预测股票回报的有效隐藏因子。