摘要
arXiv:2502.12568v2 宣传类型:交叉
摘要:与人类一样,大规模语言模型(LLMs)在一次生成高质量长文本时难以遵守严格的要求。这一挑战并不令人惊讶,因为在《认知写作理论》中,成功的人类写作被认为是一个复杂的认知过程,涉及迭代规划、翻译、审阅和监控。受到这些认知原则的启发,我们希望通过CogWriter这一新型无需训练的框架来赋予LLMs类似于人类的认知写作能力,将受约束的长文本生成转化为一种系统性的认知写作范式。我们的框架包含两个关键模块:(1)一个计划代理,它执行层次化的规划来分解任务,以及(2)多个并行执行这些计划的生成代理。系统通过持续的监控和审阅机制来保持质量,这些机制会评估输出是否符合指定的要求,并触发必要的修改。CogWriter在LongGenBench这一复杂受约束长文本生成基准上的表现非常出色。即使使用Qwen-2.5-14B作为其基础模型,CogWriter在复杂指令完成准确性上也超过了GPT-4o 22%,同时可靠地生成了超过10,000字的文章。我们希望这一受到认知科学启发的方法能为LLMs写作的进步提供一种范式:\href{https://github.com/KaiyangWan/CogWriter}{CogWriter}。