LLM2D

摘要

我们提出了一种名为程序轨迹提示的思维链 (CoT) 提示变体，它在保留 CoT 的强大功能、通用性和灵活性的同时，使解释更易于观察。在我们的方法中，少量样本 CoT 演示被包装在基于 Python 的正式语法中，每个提示：识别和命名步骤；定义步骤的输入/输出行为；并将上下文示例中 CoT 解释替换为在相同示例上这些形式化步骤的链。程序轨迹提示适用于许多任务，在 BIG-Bench Hard 基准测试中的 23 个不同任务上取得了显著的成果。更重要的是，通过以这种方式对解释进行检测，我们能够进行新的类型分析。特别是，我们识别出“非局部错误”（对应于错误地学习演示中说明的推理方法）作为 CoT 学习中一个尚未解决的问题，并且我们提出了验证 CoT 解释中步骤的模块化的方法。