摘要
arXiv:2412.10422v3 宣布类型:替换交叉
摘要:关于表格的自然语言(NL)问题解答,即表格问答(TQA),是至关重要的,因为它使用户能够快速而有效地从结构化数据中提取有意义的见解,从而有效地弥合了人类语言与机器可读格式之间的差距。许多这样的表格源于网络来源或现实世界场景,这要求进行细致的数据准备(或数据准备)以确保准确的回答。然而,为NL问题准备这样的表格引入了新的要求,这些要求超越了传统的数据准备。这种问题敏感的数据准备涉及如列推导和针对特定问题的过滤等特定任务,以及问题敏感的价值归一化或转换,突显了在这一背景下需要更细致方法的需求。由于上述每个任务都是独特的,单一模型(或代理)可能无法在所有场景中有效工作。在本文中,我们提出了AutoPrep,这是一种基于大型语言模型(LLM)的多代理框架,利用多个代理的优势,每个代理专长于某种类型的数据准备,从而确保更准确和上下文相关性的回答。给定一个针对表格的NL问题,AutoPrep 通过三个关键组件执行数据准备。规划师:确定一种逻辑计划,概述一系列高级操作的顺序。程序员:将该逻辑计划转换为物理计划,通过生成相应的低级代码。执行器:执行生成的代码以处理表格。为了支持这种多代理框架,我们设计了一种新颖的Chain-of-Clauses 原理推理机制,用于高级操作建议,以及用于低级代码生成的工具增强方法……