LLM2D
法律领域的自然语言处理:任务、数据集、模型与挑战综述
Natural Language Processing for the Legal Domain: A Survey of Tasks, Datasets, Models, and Challenges
作者: Farid Ariai, Gianluca Demartini
发布日期: 3/26/2025
arXiv ID: oai:arXiv.org:2410.21306v2

摘要

arXiv:2410.21306v2 宣告类型: replace-cross 摘要:自然语言处理(NLP)正在彻底改变法律专业人士和普通人在法律领域的操作方式。NLP 在法律领域的巨大潜力,尤其是在开发各种法律流程的计算工具方面,多年来已经吸引了研究人员的兴趣。本次综述遵循《系统评价和荟萃分析优先报告项目》框架,共review了154篇研究,经过手动筛选后最终选择了133篇。本文探索了法学领域内NLP的基础概念,阐述了处理法律文本的独特方面和挑战,如文件长度广泛、语言复杂以及有限的开放法律数据集。本文概述了特定于法律文本的NLP任务,如法律文档摘要、法律命名实体识别、法律问答、法律论据挖掘、法律文本分类和法律判决预测。在法律语言模型(LMs)部分,我们分析了已开发的LMs及其适应法律领域的各种方法。此外,我们还确定了16个开放研究挑战,包括人工智能应用中的偏见、需要更稳健和可解释的模型,以及提高解释性以应对法律语言和推理的复杂性。