LLM2D

摘要

我们提出了一种名为“程序轨迹提示”的思维链（CoT）提示变体，它在保留 CoT 的强大功能、通用性和灵活性的同时，使解释更加可观察。在我们的方法中，少样本 CoT 演示被包装在一个基于 Python 的形式语法中，每个提示：识别和命名步骤；定义步骤的输入/输出行为；并用相同示例上这些形式化步骤的链替换上下文中示例的 CoT 解释。程序轨迹提示适用于许多任务，在 BIG-Bench Hard 基准的 23 个不同任务中取得了强劲的结果。更重要的是，通过以这种方式对解释进行仪器化，我们能够进行新的类型分析。特别是，我们确定了“非局部错误”（对应于错误地学习演示中说明的推理方法）作为 CoT 学习中尚未解决的问题，并且我们提出了验证 CoT 解释中步骤的模块化的方法。