LLM2D

摘要

arXiv:2410.12126v2 宣告类型：替换摘要：图形作为一种关系型数据结构，已被广泛应用于各种应用场景，如分子设计和推荐系统。最近，大规模语言模型（LLMs）在人工智能社区中重新组合，因其预期的推理和推理能力。使LLMs理解基于图形的关系型数据具有巨大的潜力，包括但不限于（1）从外部知识库中提炼外部知识，以消除幻觉并突破LLMs在检索增强生成过程中的上下文窗口限制；（2）将图形数据作为输入并直接解决基于图形的研究任务，如蛋白质设计和药物发现。然而，将整个图形数据输入LLMs是不切实际的，因为其复杂的拓扑结构、数据量和缺乏有效的高效语义图形表示。一个自然的问题出现了：是否存在一种图形表示，可以由自然语言描述，便于LLMs理解，并且易于作为LLMs的原始输入使用？基于统计计算，图形法预先定义了一组参数（例如，度，时间，直径），并通过观察大量真实世界图形数据的拓扑分布来识别它们的关系和值。我们认为这种图形的参数化表示，图形法，可以成为使LLMs理解作为输入的图形数据的解决方案。在这篇综述中，我们首先从宏观和微观视角、低阶和高阶图形、静态和动态图形、不同的观测空间以及新提出的图形参数等多个方面回顾图形法的先前研究。在回顾了各种受益于图形法指导的实际应用之后，我们以当前挑战和未来研究方向作为论文的结尾。