LLM2D

摘要

arXiv:2505.02139v1 宣传类型: 交叉摘要: 限价订单簿（LOB）是金融市场中最重要的数据之一，提供了市场动态的精细视角，但由于其强烈的自相关性、跨特征约束和特征尺度差异，给受推崇的深度模型带来了重大挑战。现有方法往往以端到端的方式紧密地将表示学习与特定下游任务耦合在一起，无法单独和明确地分析学习到的表示，限制了它们的再利用性和泛化能力。本文首次系统地比较了订单簿表示学习，旨在识别有效提取可迁移、紧凑特征的方法，这些特征能够捕捉到订单簿的基本属性。我们引入了LOBench，这是一款标准化基准，使用真实的中国A股市场数据，提供了精心准备的数据集、统一的预处理、一致的评估指标以及强大的基准模型。广泛实验验证了订单簿表示在各种下游任务中的充分性和必要性，并突显了它们优于传统特定任务端到端模型和先进表示学习模型的时间序列泛化优势。我们的工作确立了一个可复制的框架，并为未来的研究提供了清晰的指导。数据集和代码将在 https://github.com/financial-simulation-lab/LOBench 公开可用。