LLM2D
PARAMANU-AYN:从零开始预训练还是持续预训练法律领域大模型?
PARAMANU-AYN: Pretrain from scratch or Continual Pretraining of LLMs for Legal Domain Adaptation?
作者: Mitodru Niyogi, Arnab Bhattacharya
发布日期: 10/4/2024
arXiv ID: oai:arXiv.org:2403.13681v2

摘要

本文介绍了 Paramanu-Ayn,一个专门针对印度法律案例文档训练的法律语言模型集合。该模型拥有 9700 万个参数,采用的是仅解码器(AR)自回归模型,在单个 GPU 上以 8192 的上下文大小从头开始预训练,仅训练了 185 小时,实现了 41.35 的高效 MFU。我们还开发了一个专门针对法律领域的 BPE 分词器。我们使用困惑度和零样本任务对模型进行了评估:带解释的案例判决预测和摘要式案例总结。在带解释的案例判决预测任务中,Paramanu-Ayn 的测试准确率比 Llama-2 7B 和 Gemini-Pro 高出近 2 个百分点,尽管其规模小了 72 倍。在零样本摘要式总结中,它在 BLEU 和 METEOR 指标上比生成固定长度摘要(5000 个词符)的仅解码器 LLM 高出 10 个百分点以上,在 BERTScore 指标上高出近 4 个百分点。在零样本常识和数学基准测试中,Paramanu-Ayn 表现出色,尽管它只在法律文档上进行训练,但在 AGIEVAL-AQuA-RAT 和 AGIEVAL-SAT-Math 任务中仍然优于 Llama-1、Llama-2 和 Falcon。我们还在 10763 个不同的法律任务上对我们的模型进行了指令微调,包括法律条款生成、法律草案、案例摘要等。Paramanu-Ayn-instruct 模型在清晰度、相关性、完整性和法律推理指标上均获得了 GPT-3.5-Turbo 的 8 分以上。我们发现,我们的模型能够学习起草知识,并能够在有限的指令微调下泛化到法律合同和法律条款的起草。因此,我们得出结论,对于强大的领域专用生成语言模型(如法律),从头开始进行领域专用预训练更加经济高效、环保,并且在与更大模型的竞争中仍然具有优势,甚至优于将 LLM 调整用于法律领域任务。