摘要
arXiv:2502.13544v1 类型:交叉
摘要:尽管大型语言模型(LLMs)取得了快速进展,但它们的可调控长度文本生成(LCTG)能力仍然不尽如人意,这为实际应用带来了重大限制。现有方法主要集中在端到端训练以增强对长度约束的遵守。然而,LCTG子能力的缺乏分解和针对性增强限制了进一步的进步。为了解决这一差距,我们以人类模式为参考,进行了自底向上的LCTG子能力分解,并进行了详细错误分析。在此基础上,我们提出了一个简单而有效的Plug-and-Play方法MarkerGen,其包括:(1)通过外部工具集成来缓解LLM的基本缺陷;(2)通过动态插入标记进行显式的长度建模;(3)采用三阶段生成方案以更好地对齐长度约束同时保持内容质量。全面的实验表明,MarkerGen显著改进了各种设置下LCTG的效果,显示出卓越的有效性和泛化能力。