摘要
arXiv:2504.13125v1 Announce Type: 跨域
摘要:本文研究了大语言模型(LLMs)在金融任务中的应用。我们使用Open FinLLM Leaderboard作为基准,对基础模型进行了微调。基于Qwen2.5和Deepseek-R1,我们采用了监督微调(SFT)、直接偏好优化(DPO)和强化学习(RL)等技术来增强它们的金融能力。微调后的模型在广泛的金融任务中展示了显著的性能提升。此外,我们测量了金融领域的数据规模法则。我们的工作展示了大语言模型(LLMs)在金融应用中的潜在价值。