摘要
arXiv:2502.12998v1 类别: cross
摘要:本文研究了在回答预测分数上的个性化查询时,昂贵的外部或acles(如大型语言模型)的应用性。这些预测分数是由用户定义的函数产生的,用于在多模态数据上回答个性化查询。我们提出了一种通用的计算框架,该框架能够处理任意的基于集合的评分函数,只要这些函数可以分解成每个部分可以发送给或acles(在我们的情况下是LLM)来预测部分评分的形式。在某一时间点上,该框架假设一系列响应和它们的部分预测分数,并维护一个可能的集合列表,这些集合可能是真正的top-k。由于调用或acles是昂贵的,我们的框架巧妙地确定了下一个构建部分,即下一个最佳问题,以便在最大程度上提高识别真正top-k的可能性。我们提出了一个基于原理的概率模型来量化这种可能性。我们研究了设计算法时的效率机会。我们使用三个大规模数据集、评分函数和基线进行了评估。实验表明,我们的框架在LLM调用数量上取得了数量级的改进,同时保证了结果准确性。进一步的可扩展性实验表明,我们的框架可以在大规模应用中使用。