LLM2D

摘要

arXiv:2504.18942v1 类型: cross 摘要：法律从业人员，特别是初入职业生涯的从业者，面临着复杂、高风险的任务，这些任务需要适应性和上下文相关的推理能力。虽然人工智能在支持法律工作方面具有潜力，但现有的数据集和模型主要集中于孤立的子任务，而未能捕捉到在实际法律实践中的端到端决策过程。为了填补这一空白，我们介绍了LawFlow，这是一个源自受训法律学生，基于实际企业实体创立情景的完整端到端法律工作流程数据集。与专注于输入-输出对或线性思维链条的先前数据集不同，LawFlow捕捉到了动态、模块化和迭代的推理过程，这些过程反映了法律实践中模糊性、修订和客户适应性的策略。利用LawFlow，我们比较了人类和生成式大模型的工作流程，揭示了结构、推理灵活性和计划执行方面的系统性差异。人类工作流程往往具有模块化和适应性，而生成式大模型的工作流程则更为序列化、详尽，并且对下游影响不那么敏感。我们的研究结果还表明，法律专业人士更倾向于让人工智能承担辅助角色，如头脑风暴、识别盲点和提出替代方案，而不是执行复杂的端到端工作流程。基于这些发现，我们提出了基于实证观察的一套设计建议，旨在通过混合规划、适应性执行和决策点支持，使人工智能援助与人类旨在提高清晰度、完整性、创造力和效率的目标相一致。我们的结果突出显示了生成式大模型在支持复杂法律工作流程方面的当前局限性，以及开发更多协作和推理意识的法律人工智能系统的机遇。所有数据和代码均可在我们的项目页面（https://minnesotanlp.github.io/LawFlow-website/）上获取。