LLM2D

摘要

arXiv:2501.09768v2 宣告类型: replace-cross 摘要：大型语言模型（LLMs）在跨多种领域自然语言处理（NLP）任务中展现了卓越的能力。然而，它们在低资源语言如阿拉伯语的专门任务，如法律判决预测（LJP）中的应用仍然鲜有探索。在这项工作中，我们通过从沙特商业法庭判决收集并预处理数据，填补这一空白，开发了一个阿拉伯语LJP数据集。我们使用零样本、单样本和使用QLoRA微调等不同配置方式，对标最先进的开源LLMs，包括LLaMA-3.2-3B和LLaMA-3.1-8B。此外，我们采用了综合评估框架，结合定量指标（BLEU和ROUGE）和定性评估（连贯性、法律语言、清晰度）。我们的结果表明，微调后的较小模型在特定任务中可达到与较大模型相当的性能，同时具有显著的资源效率。另外，我们还研究了提示工程和微调对模型输出的影响，提供了对性能变化和指令敏感性的见解。通过公开数据集、实现代码和模型，我们为未来阿拉伯语法律NLP的研究奠定了坚实的基础。