摘要
arXiv:2505.07078v1 类别:交叉领域
摘要:大规模语言模型(LLMs)最近被用于资产定价任务和股票交易应用中,使AI代理能够从非结构化的金融数据中生成投资决策。然而,大多数基于时间的LLM投资策略评估都是在狭窄的时间框架和有限的股票 universe 中进行的,由于幸存者偏差和数据淘金偏见,导致其效果被夸大。我们通过提出FINSABER回测框架,评估跨更长时期和更大股票 universe 的基于时间的投资策略,对其的一般性和稳健性进行了严格评估。为期二十年和100多种股票的系统回测揭示了之前报道的LLM优势在更广泛的横截面和更长期内评估时显著减弱。我们的市场制度分析进一步显示,LLM策略在牛市中过于保守,表现逊于被动基准,在熊市中过于激进,导致严重亏损。这些发现突显了开发能够优先考虑趋势检测和制度意识风险控制,而不是简单地增加框架复杂性的LLM策略的必要性。