LLM2D

摘要

数据是大型语言模型 (LLM) 对齐的关键要素。最近的研究探索了使用 LLM 进行高效数据收集。然而，LLM 生成的數據往往存在質量问题，例如代表性不足或缺失的方面以及低质量数据点。为了解决这些问题，我们提出了 Data Advisor，这是一种增强的基于 LLM 的方法，用于生成考虑目标数据集特性的数据。从一组预定义的原则入手，Data Advisor 监控生成数据的状况，识别当前数据集的弱点，并相应地建议下一轮数据生成。Data Advisor 可以轻松地集成到现有的数据生成方法中，以提高数据质量和覆盖率。对三个代表性 LLM（即 Mistral、Llama2 和 Falcon）进行的安全对齐实验表明，Data Advisor 在增强模型安全性方面非常有效，可以防止各种细粒度的安全问题，而不会牺牲模型效用。