LLM2D

摘要

在本研究中，我们探讨了针对混合表格和文本数据的问答 (QA) 问题，这种数据形式在网络上十分常见（例如，美国证券交易委员会文件），其中经常需要离散推理能力。最近，像 GPT-4 这样的大型语言模型 (LLM) 已展现出强大的多步骤推理能力。因此，我们考虑利用 LLM 的强大功能来解决我们的任务。我们抽象出一个针对表格和文本 QA 的分步管道，该管道包含三个关键步骤，包括提取器、推理器和执行器，并最初设计一个指令来实例化该管道并验证 GPT-4 的性能优于所有现有方法。然而，使用像 GPT-4 这样的在线 LLM 会带来成本、延迟和数据安全风险等挑战，这促使我们针对该任务专门化更小的 LLM。我们通过使用来自现有专家标注数据集的自动生成训练数据，对 LLaMA 2 进行微调，开发了一个 TAT-LLM 语言模型，该模型遵循分步管道。实验结果验证了我们的 TAT-LLM 模型能够在 FinQA、TAT-QA 和 TAT-DQA 基准上优于所有基线模型，包括之前最佳的微调模型和像 GPT-4 这样的超大型 LLM。