摘要
arXiv:2504.10936v1 声明类型: cross
摘要: 因果发现通常依赖于应用于观测数据的统计方法,这通常需要大容量的数据集和对潜在因果结构的假设。近年来,大型语言模型(LLMs)的进展为因果发现引入了新的可能性,因为它提供了领域专家的知识。然而,目前尚不清楚LLMs是否能够有效地处理观测数据以进行因果发现。在这项工作中,我们通过将观测数据整合到LLM推理中,探讨了LLMs在数据驱动的因果发现方面的可行性。具体来说,我们研究了两种提示策略(成对提示和广度优先搜索(BFS)提示)是否能使LLMs有效利用观测数据。在两种方法中,我们将观测数据直接纳入提示中,以评估LLMs从这类数据中推断因果关系的能力。基准数据集上的实验表明,整合观测数据可以增强因果发现,使用成对和BFS LLM提示,F1分数提高了最多0.11点,同时比传统的统计因果发现基线提高了最多0.52点。我们的研究突显了LLMs在数据驱动的因果发现中的潜力和局限性,展示了它们能够超越文本元数据,有效解释和利用观测数据进行更有针对性的因果推理的能力。我们的研究为未来全LLM驱动的因果发现的发展奠定了基础。