LLM2D

摘要

arXiv:2502.12998v1 类别: cross 摘要：本文研究了在回答预测分数上的个性化查询时，昂贵的外部或acles（如大型语言模型）的应用性。这些预测分数是由用户定义的函数产生的，用于在多模态数据上回答个性化查询。我们提出了一种通用的计算框架，该框架能够处理任意的基于集合的评分函数，只要这些函数可以分解成每个部分可以发送给或acles（在我们的情况下是LLM）来预测部分评分的形式。在某一时间点上，该框架假设一系列响应和它们的部分预测分数，并维护一个可能的集合列表，这些集合可能是真正的top-k。由于调用或acles是昂贵的，我们的框架巧妙地确定了下一个构建部分，即下一个最佳问题，以便在最大程度上提高识别真正top-k的可能性。我们提出了一个基于原理的概率模型来量化这种可能性。我们研究了设计算法时的效率机会。我们使用三个大规模数据集、评分函数和基线进行了评估。实验表明，我们的框架在LLM调用数量上取得了数量级的改进，同时保证了结果准确性。进一步的可扩展性实验表明，我们的框架可以在大规模应用中使用。