摘要
数据是大型语言模型 (LLM) 对齐的关键要素。最近的研究探索了使用 LLM 进行高效数据收集。然而,LLM 生成的數據往往存在質量问题,例如代表性不足或缺失的方面以及低质量数据点。为了解决这些问题,我们提出了 Data Advisor,这是一种增强的基于 LLM 的方法,用于生成考虑目标数据集特性的数据。从一组预定义的原则入手,Data Advisor 监控生成数据的状况,识别当前数据集的弱点,并相应地建议下一轮数据生成。Data Advisor 可以轻松地集成到现有的数据生成方法中,以提高数据质量和覆盖率。对三个代表性 LLM(即 Mistral、Llama2 和 Falcon)进行的安全对齐实验表明,Data Advisor 在增强模型安全性方面非常有效,可以防止各种细粒度的安全问题,而不会牺牲模型效用。