LLM2D

摘要

arXiv:2502.14050v2 宣传类型: 替换-交叉摘要：指令调优数据由于数据收集量大和快速的模型迭代，往往已经数量饱和，使得数据选择变得重要但尚未得到充分利用。现有的以质量为导向的数据选择方法，如 LIMA（NeurIPS 2023，[zhou2024lima]）和 AlpaGasus（ICLR 2024，[chenalpagasus]），通常忽略了数据多样性和复杂性的同等重要性。在这项工作中，我们旨在设计一种兼顾多样性的数据选择策略，并创造性地提出使用稀疏自编码器（SAEs）来应对数据多样性度量的挑战。此外，SAEs 还可以提供更多有关模型行为的可解释性，比如选择最长响应的效果令人惊讶（ICML 2024，[zhaolong]）。通过有效的数据选择，我们实验性地证明，使用我们选择的数据训练的模型在模型能力方面可以超越其他方法，降低训练成本，并且有可能更好地控制模型行为。我们证明了 SAEs 可以作为一种良好的多样性度量替代方案，并设计我们的方法以适用于潜在的工业大规模剪枝，并且我们将发布我们的训练好的 SAEs 供更广泛的社区使用。