摘要
arXiv:2503.24028v1 公告类型: 新
摘要:指令调优已成为定制大型语言模型行为的关键方法。最近的工作揭示了通过有限数量的高质量指令数据进行微调可以使大型语言模型实现高性能的潜力。在此基础上,我们进一步探索指令数据选择的提示鲁棒性的影响。本文提出了一种开创性的高质量在线指令数据挖掘框架,专注于提示鲁棒性对数据挖掘过程的影响。我们的主要创新在于通过针对在线指令数据的提示进行攻击生成对抗指令数据。然后,我们引入了对抗指令跟随难度指标来衡量对抗指令数据对生成相应响应的帮助程度。此外,我们提出了一种新的对抗指令输出嵌入一致性的方法来选择高质量的在线指令数据。我们在两个基准数据集上进行了广泛的实验以评估性能。实验结果表明了我们提出的方法的有效性。此外,实验结果强调了考虑提示鲁棒性的重要实际意义。