LLM2D
DOMBA: 双模型平衡方法 via 最小边界聚集用于访问控制语言模型
DOMBA: Double Model Balancing for Access-Controlled Language Models via Minimum-Bounded Aggregation
作者: Tom Segal, Asaf Shabtai, Yuval Elovici
发布日期: 2/11/2025
arXiv ID: oai:arXiv.org:2408.11121v2

摘要

arXiv:2408.11121v2 宣布类型: replace-cross 摘要:大型语言模型(LLMs)的质量和训练数据的数量对其有用性影响很大。许多组织拥有可以用于训练或微调定制于其特定需求的LLMs的大量数据集。然而,这些数据集通常带有基于用户权限的访问限制,并且通过访问控制机制来实施。在这些数据集上训练LLMs可能暴露出敏感信息给未经授权的用户。防止这种暴露的简单方法是为每个访问级别训练一个单独的模型。然而,这可能会导致具有较低实用性的模型,因为与整个组织数据集相比,每个模型的训练数据量较少。另一种方法是在所有数据上训练一个单一的LLMs,同时限制未经授权信息的暴露。然而,当前用于LLMs的暴露限制方法对于访问受限的数据无效,在这种数据中敏感信息在许多训练示例中频繁出现。我们提出了一种称为DOMBA(双重模型平衡)的简单方法,用于训练和部署LLMs,该方法在提供高实用性和访问控制功能的同时提供安全保障。DOMBA通过“最小边界”平均函数(如调和平均函数)聚合两个模型的概率分布,每个模型分别在具有(可能很多)不同访问级别的文档上进行训练。详细的数学分析和广泛的评估表明,DOMBA可以保护受限信息,同时提供与非安全模型相当的实用性。