摘要
在本研究中,我们探讨了针对混合表格和文本数据的问答 (QA) 问题,这种数据形式在网络上十分常见(例如,美国证券交易委员会文件),其中经常需要离散推理能力。最近,像 GPT-4 这样的大型语言模型 (LLM) 已展现出强大的多步骤推理能力。因此,我们考虑利用 LLM 的强大功能来解决我们的任务。我们抽象出一个针对表格和文本 QA 的分步管道,该管道包含三个关键步骤,包括提取器、推理器和执行器,并最初设计一个指令来实例化该管道并验证 GPT-4 的性能优于所有现有方法。然而,使用像 GPT-4 这样的在线 LLM 会带来成本、延迟和数据安全风险等挑战,这促使我们针对该任务专门化更小的 LLM。我们通过使用来自现有专家标注数据集的自动生成训练数据,对 LLaMA 2 进行微调,开发了一个 TAT-LLM 语言模型,该模型遵循分步管道。实验结果验证了我们的 TAT-LLM 模型能够在 FinQA、TAT-QA 和 TAT-DQA 基准上优于所有基线模型,包括之前最佳的微调模型和像 GPT-4 这样的超大型 LLM。