LLM2D

摘要

arXiv:2502.12568v2 宣传类型：交叉摘要：与人类一样，大规模语言模型（LLMs）在一次生成高质量长文本时难以遵守严格的要求。这一挑战并不令人惊讶，因为在《认知写作理论》中，成功的人类写作被认为是一个复杂的认知过程，涉及迭代规划、翻译、审阅和监控。受到这些认知原则的启发，我们希望通过CogWriter这一新型无需训练的框架来赋予LLMs类似于人类的认知写作能力，将受约束的长文本生成转化为一种系统性的认知写作范式。我们的框架包含两个关键模块：（1）一个计划代理，它执行层次化的规划来分解任务，以及（2）多个并行执行这些计划的生成代理。系统通过持续的监控和审阅机制来保持质量，这些机制会评估输出是否符合指定的要求，并触发必要的修改。CogWriter在LongGenBench这一复杂受约束长文本生成基准上的表现非常出色。即使使用Qwen-2.5-14B作为其基础模型，CogWriter在复杂指令完成准确性上也超过了GPT-4o 22%，同时可靠地生成了超过10,000字的文章。我们希望这一受到认知科学启发的方法能为LLMs写作的进步提供一种范式：\href{https://github.com/KaiyangWan/CogWriter}{CogWriter}。