LLM2D

摘要

arXiv:2402.01454v5 宣布类型: replace-cross 摘要: 在实际统计因果发现（SCD）中，将领域专家知识嵌入算法作为约束对于合理反映领域专家广泛知识的因果模型非常重要，尽管系统获取背景知识面临着挑战。为了克服这些挑战，本文提出了一种新的因果推理方法，该方法通过“面向大语言模型的统计因果提示（SCP）”将SCD与大型语言模型（LLM）的知识基础因果推理（KBCI）结合在一起，并对SCD进行先验知识增强。本文中的实验表明，LLM-KBCI和使用LLM-KBCI增强的SCD的结果接近真实值，而不是没有先验知识的SCD结果。此外，实验还表明，如果LLM经过SCP处理，SCD结果可以进一步改进。此外，使用一个未公布的实际数据集，我们证明了LLM提供的背景知识可以改善该数据集的SCD，即使该数据集从未包含在LLM的训练数据中。对于本方法在未来在医疗保健等重要领域的实际应用，本文还详细讨论了限制、关键错误的风险、围绕LLM的技术改进预期、以及将结果的专家检查整合到此自动过程中的现实性，包括在成功和失败情景下的各种条件下进行SCP模拟。因此，适当应用本文提出的方法，并针对每个领域进行改进和定制，可以解决数据偏差和限制等问题，展示了LLM在不同科学领域的数据驱动因果发现方面的潜力。本文中使用的所有代码均可在以下链接获取：www.github.com/mas-takayama/LLM-and-SCD