LLM2D

摘要

arXiv:2502.13544v1 类型:交叉摘要：尽管大型语言模型（LLMs）取得了快速进展，但它们的可调控长度文本生成（LCTG）能力仍然不尽如人意，这为实际应用带来了重大限制。现有方法主要集中在端到端训练以增强对长度约束的遵守。然而，LCTG子能力的缺乏分解和针对性增强限制了进一步的进步。为了解决这一差距，我们以人类模式为参考，进行了自底向上的LCTG子能力分解，并进行了详细错误分析。在此基础上，我们提出了一个简单而有效的Plug-and-Play方法MarkerGen，其包括：（1）通过外部工具集成来缓解LLM的基本缺陷；（2）通过动态插入标记进行显式的长度建模；（3）采用三阶段生成方案以更好地对齐长度约束同时保持内容质量。全面的实验表明，MarkerGen显著改进了各种设置下LCTG的效果，显示出卓越的有效性和泛化能力。