LLM2D

摘要

大型语言模型（LLMs）在各种领域展现出令人印象深刻的能力，包括角色扮演、创意写作、数学推理和编码。尽管取得了这些进步，但 LLMs 在长度控制方面仍然面临挑战，由于其基于词元的操作以及缺乏对严格长度限制数据的训练，它们经常无法遵守特定的长度约束。我们确定这个问题源于缺乏位置意识，并提出了新方法——PositionID 提示和 PositionID 微调——来解决这个问题。这些方法增强了模型在生成过程中持续监控和管理文本长度的能力。此外，我们引入了 PositionID CP 提示，使 LLMs 能够准确地执行复制和粘贴操作。此外，我们开发了两个基准来评估长度控制和复制粘贴能力。我们的实验表明，我们的方法显著提高了模型对长度约束的遵守程度和复制粘贴的准确性，而不会影响响应质量。