LLM2D

摘要

arXiv:2410.12846v3 宣告类型: replace-cross 摘要: 自由格式表格上的问答（又称 TableQA）是一项具有挑战性的工作，因为表格具有灵活的结构和复杂的模式。近期的研究利用大型语言模型（LLMs）来执行这项任务，利用它们理解问题和表格数据的能力，这些数据通常以自然语言给出，并且包含许多文本字段。虽然这种方法显示出了令人鼓舞的结果，但它忽视了表格数据中常见的数值所带来的挑战，而 LLMs 在处理这些数值时存在问题。我们旨在解决这一问题，并提出了一个名为 TabLaP 的模型，该模型利用 LLMs 作为规划者而非答案生成器。这种方法利用了 LLMs 的多步推理能力，将实际的数值计算留给 Python 解释器进行准确的计算。鉴于 LLMs 的不准确特性，我们进一步尝试量化 TabLaP 生成的答案的可信度，以便用户可以以后悔意识的方式使用 TabLaP。在两个基准数据集上的实验结果表明，TabLaP 在准确度上显著优于最先进的模型，在两个数据集上分别提高了 5.7% 和 5.8% 的答案准确度。