摘要
arXiv:2412.00749v2 Announce Type: replace-cross
摘要:随着对大规模数据分析需求的增长,许多数据库管理系统(DBMS)已经采用了复杂的底层查询执行机制,包括向量化操作、并行执行和动态管道修改。然而,目前仍然缺乏针对这些复杂执行机制及其相互作用的专门查询性能预测(QPP)方法,因为现有的大多数方法主要关注传统树形查询计划和静态串行执行器。为了解决这一挑战,本文提出了一种名为CONCERTO的复杂查询执行机制学习成本估计方法。CONCERTO首先为每个物理操作建立了独立的资源成本模型。然后,它构建了一个由数据流树骨干和并发操作之间的资源竞争关系组成的有向无环图(DAG)。通过使用带有附加注意机制的图注意力网络(GATs)校准并行操作执行的成本影响后,CONCERTO通过时间卷积神经网络(TCNs)提取并聚合成本向量树,最终实现了有效的查询性能预测。实验结果证明,CONCERTO在预测准确性上优于现有方法。