LLM2D

摘要

arXiv:2502.00865v1 宣布类型: cross 摘要：本文应对了消费者合同中日益严重的信息不对称问题，这些问题由日益普及的支持复杂用户协议的在线服务所加剧，而这些协议很少甚至不会被阅读。尽管已经开展了针对自动分析方法的研究，但由于一般倾向于英语语言的机器学习方法和主要管辖区（如欧盟），这一问题变得更加严重。我们提出了一种新的方法论和大量数据集来解决这一缺口。我们提出了一种新颖的注释方案，包括四个类别和总共20个子类别，并将其应用于智利使用的50个在线用户协议。对于基于变换器的模型的评估揭示了语言特定或领域特定的预训练、少量样本数量以及模型结构等因素如何影响潜在滥用条款的检测和分类。结果显示不同任务和模型间性能差异很大，检测任务的宏观F1分数范围从79%到89%，微F1分数最高可达96%，而分类任务的宏观F1分数范围从60%到70%，微F1分数范围从64%到80%。值得注意的是，这是第一个针对法律条款的多标签分类数据集，适用于智利法律，并提供了对西班牙语法律领域模型的全面评估。我们的工作为未来罕见考虑的法律分析方法的发展奠定了基础，并可能有助于支持智利和拉丁美洲整体的消费者权益。