LLM2D
从亚能力诊断到人类对齐生成:通过MARKERGEN桥接文本长度控制的差距
From Sub-Ability Diagnosis to Human-Aligned Generation: Bridging the Gap for Text Length Control via MARKERGEN
作者: Peiwen Yuan, Chuyi Tan, Shaoxiong Feng, Yiwei Li, Xinglin Wang, Yueqi Zhang, Jiayi Shi, Boyuan Pan, Yao Hu, Kan Li
发布日期: 2/20/2025
arXiv ID: oai:arXiv.org:2502.13544v1

摘要

arXiv:2502.13544v1 类型:交叉 摘要:尽管大型语言模型(LLMs)取得了快速进展,但它们的可调控长度文本生成(LCTG)能力仍然不尽如人意,这为实际应用带来了重大限制。现有方法主要集中在端到端训练以增强对长度约束的遵守。然而,LCTG子能力的缺乏分解和针对性增强限制了进一步的进步。为了解决这一差距,我们以人类模式为参考,进行了自底向上的LCTG子能力分解,并进行了详细错误分析。在此基础上,我们提出了一个简单而有效的Plug-and-Play方法MarkerGen,其包括:(1)通过外部工具集成来缓解LLM的基本缺陷;(2)通过动态插入标记进行显式的长度建模;(3)采用三阶段生成方案以更好地对齐长度约束同时保持内容质量。全面的实验表明,MarkerGen显著改进了各种设置下LCTG的效果,显示出卓越的有效性和泛化能力。