LLM2D
大型语言模型能预测司法判决的结果吗?
Can Large Language Models Predict the Outcome of Judicial Decisions?
作者: Mohamed Bayan Kmainasi, Ali Ezzat Shahroor, Amani Al-Ghraibah
发布日期: 2/6/2025
arXiv ID: oai:arXiv.org:2501.09768v2

摘要

arXiv:2501.09768v2 宣告类型: replace-cross 摘要:大型语言模型(LLMs)在跨多种领域自然语言处理(NLP)任务中展现了卓越的能力。然而,它们在低资源语言如阿拉伯语的专门任务,如法律判决预测(LJP)中的应用仍然鲜有探索。在这项工作中,我们通过从沙特商业法庭判决收集并预处理数据,填补这一空白,开发了一个阿拉伯语LJP数据集。我们使用零样本、单样本和使用QLoRA微调等不同配置方式,对标最先进的开源LLMs,包括LLaMA-3.2-3B和LLaMA-3.1-8B。此外,我们采用了综合评估框架,结合定量指标(BLEU和ROUGE)和定性评估(连贯性、法律语言、清晰度)。我们的结果表明,微调后的较小模型在特定任务中可达到与较大模型相当的性能,同时具有显著的资源效率。另外,我们还研究了提示工程和微调对模型输出的影响,提供了对性能变化和指令敏感性的见解。通过公开数据集、实现代码和模型,我们为未来阿拉伯语法律NLP的研究奠定了坚实的基础。