LLM2D
通过使用大规模预训练语言模型构建法律题库,将法律知识普及给公众
Bringing legal knowledge to the public by constructing a legal question bank using large-scale pre-trained language model
作者: Mingruo Yuan, Ben Kao, Tien-Hsuan Wu, Michael M. K. Cheung, Henry W. H. Chan, Anne S. Y. Cheung, Felix W. H. Chan, Yongxi Chen
发布日期: 5/8/2025
arXiv ID: oai:arXiv.org:2505.04132v1

摘要

arXiv:2505.04132v1 公告类型:交叉 摘要:获取法律信息是获得正义的基础。然而,“可访问性”不仅指法律文件向公众提供,还包括使公众理解这些法律信息。向公众提供法律信息的一个棘手问题是,如何将立法和判决等正式的法律文件(这些文件往往非常技术性),转化为普通人容易导航和理解的知识。在本研究中,我们制定了一个三步方法来将法律知识带给非专业人士,解决可导航性和可理解性的问题。首先,我们将法律中选定的部分翻译成片段(称为CLIC页),每个片段都是一个小文章,专注于用非法律术语解释特定的法律概念。其次,我们构建了一个法律问题银行(LQB),这是一个包含合法问题的集合,其答案可以在CLIC页中找到。第三,我们设计了一个交互式的CLIC推荐器(CRec)。给定用户对需要法律解决方案的法律情况的口头描述,CRec 解释用户的输入,并从问题银行中精选出与给定法律情况最相关的几个问题,并推荐相应的CLIC页面,其中包含相关的法律知识。在本文中,我们重点关注创建LQB的技术方面。我们展示了如何使用大型预训练语言模型(如GPT-3)生成法律问题。我们将机器生成的问题(MGQs)与人工编写的提问(HCQs)进行了比较,发现MGQs更具可扩展性、成本效益和多样性,而HCQs更为精确。我们还展示了CRec的原型,并通过一个例子说明了我们三步方法如何有效将相关法律知识带给公众。