LLM2D
面向表格问答的准确且后悔意识的数值问题求解器
Accurate and Regret-aware Numerical Problem Solver for Tabular Question Answering
作者: Yuxiang Wang, Jianzhong Qi, Junhao Gan
发布日期: 2/10/2025
arXiv ID: oai:arXiv.org:2410.12846v3

摘要

arXiv:2410.12846v3 宣告类型: replace-cross 摘要: 自由格式表格上的问答(又称 TableQA)是一项具有挑战性的工作,因为表格具有灵活的结构和复杂的模式。近期的研究利用大型语言模型(LLMs)来执行这项任务,利用它们理解问题和表格数据的能力,这些数据通常以自然语言给出,并且包含许多文本字段。虽然这种方法显示出了令人鼓舞的结果,但它忽视了表格数据中常见的数值所带来的挑战,而 LLMs 在处理这些数值时存在问题。我们旨在解决这一问题,并提出了一个名为 TabLaP 的模型,该模型利用 LLMs 作为规划者而非答案生成器。这种方法利用了 LLMs 的多步推理能力,将实际的数值计算留给 Python 解释器进行准确的计算。鉴于 LLMs 的不准确特性,我们进一步尝试量化 TabLaP 生成的答案的可信度,以便用户可以以后悔意识的方式使用 TabLaP。在两个基准数据集上的实验结果表明,TabLaP 在准确度上显著优于最先进的模型,在两个数据集上分别提高了 5.7% 和 5.8% 的答案准确度。