摘要
arXiv:2504.03486v1 交叉发布类型:cross
摘要:自动化法律文件起草可以显著提高效率、减少人工努力并简化法律工作流程。虽然之前的研究所探讨了诸如判决预测和案例摘要等任务,但印度法律领域中的私人性质法律文件的结构化生成仍然很大程度上未得到解决。为了解决这一问题,我们引入了VidhikDastaavej,一个新颖的匿名私人性质法律文件数据集,并开发了NyayaShilp,一种专门适应印度法律文本的微调法律文件生成模型。我们提出了一种模型无关的包装器(MAW),这是一种两步框架,首先生成结构化的节标题,然后迭代生成内容并利用检索机制确保连贯性和事实准确性。我们对多个开源LLM进行了基准测试,包括指令微调和领域适应版本,以及proprietary模型进行比较。我们的研究表明,虽然在小数据集上直接微调并不总是能够提高效果,但我们的结构化包装器可以显著提高连贯性、事实准确性,并提高整体文件质量,同时减轻幻觉。为了确保实际应用,我们开发了一个有人参与的循环(HITL)文档生成系统,这是一种互动用户界面,允许用户指定文档类型、细化节详细信息并生成结构化的法律草稿。该工具使法律专业人士和研究人员能够高效地生成、验证和改进AI生成的法律文件。广泛的评估,包括专家评估,确认我们的框架在结构化法律起草中具有高度可靠性。这项研究为印度的AI辅助法律起草奠定了可扩展和可适应的基础,提供了一种有效的结构化法律文件生成方法。