LLM2D

摘要

arXiv:2504.04737v1 通知类型: 交叉摘要：在基于事实判断预测与解释（FJPE）的景观中，依赖事实数据对于开发稳健和现实的AI驱动决策工具至关重要。本文介绍了TathyaNyaya，这是专门为印度法律环境设计的最大注释数据集，涵盖了印度最高法院和各个高等法院的判决。TathyaNyaya数据集的名称源于印地语词“Tathya”（事实）和“Nyaya”（正义），该数据集独特地设计用于关注事实陈述而非完整的法律文本，反映了在现实世界中，事实数据推动判决结果的司法流程。为补充这一数据集，我们提出了FactLegalLlama，这是LLMa-3-8B大型语言模型（LLM）的指令调优变体，优化用于生成高质量的FJPE任务解释。该模型在TathyaNyaya中的事实数据上进行微调，结合了预测准确性和语境相关、连贯的解释，解决了AI辅助法律系统中的透明性和可解释性的关键需求。我们的方法将变压器用于二元判决预测，结合FactLegalLlama生成解释，为推进印度法律领域的FJPE创建了一个稳健的框架。TathyaNyaya不仅在规模和多样性上超越了现有数据集，也为在法律分析中构建可解释的AI系统设定了一个基准。研究结果强调了事实精确性和领域特定调整在提高预测性能和可解释性方面的重要性，将TathyaNyaya和FactLegalLlama定位为AI辅助法律决策的基础资源。