LLM2D

摘要

arXiv:2406.17961v2 Announce Type: replace-cross 摘要：近年来，大型语言模型（LLMs）在解析文本数据和生成代码方面展现了卓越的能力。然而，在涉及表格数据的任务中，特别是在那些需要符号推理的任务中，它们的性能面临着挑战，因为网页表格中经常存在结构差异和单元格值的一致性问题。在本文中，我们提出了一种名为NormTab的新框架，旨在通过规范化网页表格来增强LLMs的符号推理性能。我们将表格规范化作为一个独立的一次性预处理步骤进行研究，使用LLMs来支持符号推理。我们在WikiTableQuestion和TabFact等具有挑战性的网页表格数据集上进行的实验评估表明，利用NormTab可以显著提高符号推理性能，展示了网页表格规范化对增强基于LLM的符号推理任务的重要性与有效性。