LLM2D

摘要

arXiv:2504.13125v1 Announce Type: 跨域摘要：本文研究了大语言模型（LLMs）在金融任务中的应用。我们使用Open FinLLM Leaderboard作为基准，对基础模型进行了微调。基于Qwen2.5和Deepseek-R1，我们采用了监督微调（SFT）、直接偏好优化（DPO）和强化学习（RL）等技术来增强它们的金融能力。微调后的模型在广泛的金融任务中展示了显著的性能提升。此外，我们测量了金融领域的数据规模法则。我们的工作展示了大语言模型（LLMs）在金融应用中的潜在价值。