LLM2D

摘要

arXiv:2408.11121v2 宣布类型: replace-cross 摘要：大型语言模型（LLMs）的质量和训练数据的数量对其有用性影响很大。许多组织拥有可以用于训练或微调定制于其特定需求的LLMs的大量数据集。然而，这些数据集通常带有基于用户权限的访问限制，并且通过访问控制机制来实施。在这些数据集上训练LLMs可能暴露出敏感信息给未经授权的用户。防止这种暴露的简单方法是为每个访问级别训练一个单独的模型。然而，这可能会导致具有较低实用性的模型，因为与整个组织数据集相比，每个模型的训练数据量较少。另一种方法是在所有数据上训练一个单一的LLMs，同时限制未经授权信息的暴露。然而，当前用于LLMs的暴露限制方法对于访问受限的数据无效，在这种数据中敏感信息在许多训练示例中频繁出现。我们提出了一种称为DOMBA（双重模型平衡）的简单方法，用于训练和部署LLMs，该方法在提供高实用性和访问控制功能的同时提供安全保障。DOMBA通过“最小边界”平均函数（如调和平均函数）聚合两个模型的概率分布，每个模型分别在具有（可能很多）不同访问级别的文档上进行训练。详细的数学分析和广泛的评估表明，DOMBA可以保护受限信息，同时提供与非安全模型相当的实用性。