摘要
arXiv:2502.14050v2 宣传类型: 替换-交叉
摘要:指令调优数据由于数据收集量大和快速的模型迭代,往往已经数量饱和,使得数据选择变得重要但尚未得到充分利用。现有的以质量为导向的数据选择方法,如 LIMA(NeurIPS 2023,[zhou2024lima])和 AlpaGasus(ICLR 2024,[chenalpagasus]),通常忽略了数据多样性和复杂性的同等重要性。在这项工作中,我们旨在设计一种兼顾多样性的数据选择策略,并创造性地提出使用稀疏自编码器(SAEs)来应对数据多样性度量的挑战。此外,SAEs 还可以提供更多有关模型行为的可解释性,比如选择最长响应的效果令人惊讶(ICML 2024,[zhaolong])。通过有效的数据选择,我们实验性地证明,使用我们选择的数据训练的模型在模型能力方面可以超越其他方法,降低训练成本,并且有可能更好地控制模型行为。我们证明了 SAEs 可以作为一种良好的多样性度量替代方案,并设计我们的方法以适用于潜在的工业大规模剪枝,并且我们将发布我们的训练好的 SAEs 供更广泛的社区使用。