摘要
arXiv:2406.17961v2 Announce Type: replace-cross
摘要:近年来,大型语言模型(LLMs)在解析文本数据和生成代码方面展现了卓越的能力。然而,在涉及表格数据的任务中,特别是在那些需要符号推理的任务中,它们的性能面临着挑战,因为网页表格中经常存在结构差异和单元格值的一致性问题。在本文中,我们提出了一种名为NormTab的新框架,旨在通过规范化网页表格来增强LLMs的符号推理性能。我们将表格规范化作为一个独立的一次性预处理步骤进行研究,使用LLMs来支持符号推理。我们在WikiTableQuestion和TabFact等具有挑战性的网页表格数据集上进行的实验评估表明,利用NormTab可以显著提高符号推理性能,展示了网页表格规范化对增强基于LLM的符号推理任务的重要性与有效性。