摘要
arXiv:2504.20018v1 类型: cross
摘要:向量搜索在许多实际应用场景中起着至关重要的作用。除了单向量搜索外,多向量搜索在多模态和多特征场景中变得尤为重要。在多向量数据库中,每一行是一个项目,每一列代表项目的特征,每个单元格是一个高维向量。在多向量数据库中,索引的选择对性能有很大影响。尽管关系型数据库的索引调整已经被广泛研究,但多向量搜索的索引调整仍然不清楚且具有挑战性。在本文中,我们定义了多向量搜索索引调整,并提出了一个解决该问题的框架。具体来说,给定一个多向量搜索工作负载,我们开发了算法以最小化延迟并满足存储和召回约束。与基准相比,我们的延迟实现了2.1倍至8.3倍的加速。