摘要
arXiv:2502.12568v1 类型: cross
摘要: 与人类一样,大型语言模型(LLMs)单次生成高质量长文本时难以遵守严格的规范要求。这一挑战不足为奇,根据认知写作理论,成功的写作是一个复杂的认知过程,涉及迭代规划、转换、审视和监控。受这些认知原则的启发,我们希望通过CogWriter这一新型无需训练的框架,赋予LLMs类似于人类的认知写作能力,将LLMs受限的长文本生成转化为一种系统化的认知写作范式。该框架包括两个关键模块:(1)规划代理,执行分层规划以分解任务;(2)多个生成代理,同时执行这些计划。该系统通过持续的监控和审视机制来保持质量,这些机制评估输出是否符合规定的要求,并触发必要的修订。CogWriter在LongGenBench上表现出色,LongGenBench是用于复杂受限长文本生成的标准框架。即使使用Qwen-2.5-14B作为其骨干模型,CogWriter在复杂指令完成准确性上也比GPT-4o高出22%,同时可靠地生成超过10,000字的文本。我们希望通过这种借鉴认知科学的方法为LLMs写作进步提供一个范例:\[CogWriter\]\(https://github.com/KaiyangWan/CogWriter\)。