LLM2D

摘要

arXiv:2505.07078v1 类别：交叉领域摘要：大规模语言模型（LLMs）最近被用于资产定价任务和股票交易应用中，使AI代理能够从非结构化的金融数据中生成投资决策。然而，大多数基于时间的LLM投资策略评估都是在狭窄的时间框架和有限的股票 universe 中进行的，由于幸存者偏差和数据淘金偏见，导致其效果被夸大。我们通过提出FINSABER回测框架，评估跨更长时期和更大股票 universe 的基于时间的投资策略，对其的一般性和稳健性进行了严格评估。为期二十年和100多种股票的系统回测揭示了之前报道的LLM优势在更广泛的横截面和更长期内评估时显著减弱。我们的市场制度分析进一步显示，LLM策略在牛市中过于保守，表现逊于被动基准，在熊市中过于激进，导致严重亏损。这些发现突显了开发能够优先考虑趋势检测和制度意识风险控制，而不是简单地增加框架复杂性的LLM策略的必要性。