摘要
arXiv:2502.06882v1 声明类型: cross
摘要:大型语言模型(LLMs)在法律智能方面取得了显著进展,但在实现交互式法律场景方面的进步受到了情景数据稀缺的阻碍。本文介绍了一种多代理法律模拟驱动程序(MASER),通过模拟交互式法律场景来大规模生成合成数据。利用实际的法律案例来源,MASER 确保了参与者之间的法律属性一致性,并引入了一种监督机制来使参与者的角色和行为保持一致,并解决分散注意力的问题。此外,构建了一个多阶段交互式法律评价(MILE)基准,以评估 LLMs 在动态法律场景中的性能。广泛的实验证明了我们框架的有效性。