LLM2D
NormTab: 通过表数据规范化提高大型语言模型中的符号推理能力
NormTab: Improving Symbolic Reasoning in LLMs Through Tabular Data Normalization
作者: Md Mahadi Hasan Nahid, Davood Rafiei
发布日期: 4/4/2025
arXiv ID: oai:arXiv.org:2406.17961v2

摘要

arXiv:2406.17961v2 Announce Type: replace-cross 摘要:近年来,大型语言模型(LLMs)在解析文本数据和生成代码方面展现了卓越的能力。然而,在涉及表格数据的任务中,特别是在那些需要符号推理的任务中,它们的性能面临着挑战,因为网页表格中经常存在结构差异和单元格值的一致性问题。在本文中,我们提出了一种名为NormTab的新框架,旨在通过规范化网页表格来增强LLMs的符号推理性能。我们将表格规范化作为一个独立的一次性预处理步骤进行研究,使用LLMs来支持符号推理。我们在WikiTableQuestion和TabFact等具有挑战性的网页表格数据集上进行的实验评估表明,利用NormTab可以显著提高符号推理性能,展示了网页表格规范化对增强基于LLM的符号推理任务的重要性与有效性。