LLM2D

摘要

arXiv:2504.10948v1 宣言类型: cross 摘要：子图计数是确定查询模式在大数据图中的实例数量的任务，这是许多关键应用的核心，从分析财务网络和交通系统到理解生物相互作用。尽管几十年的工作产生了高效算法（AL）解决方案，并且近年来出现了机器学习（ML）方法，但清晰的比较理解仍然难以捉摸。这种差距源于缺乏统一的评价框架、标准化数据集和可访问的参考答案，所有这些都阻碍了系统的分析和公平的基准测试。为了克服这些障碍，我们引入了BEACON：一种全面的基准测试，旨在严格评估基于AL和基于ML的子图计数方法。BEACON提供了一个标准化数据集，具有验证过的参考答案，一个集成的评估环境，以及一个公开的排行榜，使跨不同方法的可重复和透明比较成为可能。我们广泛的经验表明，尽管AL方法在高效计数非常大的图上的子图方面表现出色，但在处理复杂模式（例如，超过六个节点的模式）时却存在问题。相比之下，ML方法能够处理更大的模式，但需要大量的图数据输入，并且在小型密集图上往往导致不理想的准确性。这些见解不仅突显了每种方法的独特优势和局限性，还为未来的子图计数技术进步铺平了道路。总体而言，BEACON代表了朝着统一和加速子图计数研究迈出的重要一步，鼓励创新解决方案并促进对算法范式和机器学习范式之间权衡的更深层次理解。