LLM2D

摘要

arXiv:2504.10936v1 声明类型: cross 摘要: 因果发现通常依赖于应用于观测数据的统计方法，这通常需要大容量的数据集和对潜在因果结构的假设。近年来，大型语言模型（LLMs）的进展为因果发现引入了新的可能性，因为它提供了领域专家的知识。然而，目前尚不清楚LLMs是否能够有效地处理观测数据以进行因果发现。在这项工作中，我们通过将观测数据整合到LLM推理中，探讨了LLMs在数据驱动的因果发现方面的可行性。具体来说，我们研究了两种提示策略（成对提示和广度优先搜索（BFS）提示）是否能使LLMs有效利用观测数据。在两种方法中，我们将观测数据直接纳入提示中，以评估LLMs从这类数据中推断因果关系的能力。基准数据集上的实验表明，整合观测数据可以增强因果发现，使用成对和BFS LLM提示，F1分数提高了最多0.11点，同时比传统的统计因果发现基线提高了最多0.52点。我们的研究突显了LLMs在数据驱动的因果发现中的潜力和局限性，展示了它们能够超越文本元数据，有效解释和利用观测数据进行更有针对性的因果推理的能力。我们的研究为未来全LLM驱动的因果发现的发展奠定了基础。