LLM2D

摘要

arXiv:2502.05863v1 Announce Type: cross 摘要：在AI辅助教学中，利用各种查询样式解释抽象的文字描述对确保高质量的教学至关重要。然而，当前的检索模型主要集中在自然文本-图像检索，由于检索过程中的模糊性，使得它们在教育场景下不够针对性。本文中，我们提出了一种针对教育场景的多样化表达检索任务，支持基于多种查询样式和表达的检索。我们引入了STEM教育检索数据集（SER），包含了超过24,000个多样化的查询对，以及基于提示调优的Uni-Retrieval，这是一种高效且多样化的检索视觉-语言模型。Uni-Retrieval 提取查询样式的特征作为原型，并构建了一个包含不同查询提示词的不断更新的提示库。该库可以在测试时更新，以代表不同科目检索场景的领域特定知识。我们的框架通过基于原型相似性动态检索提示词，有效地促进了未知查询的学习。实验结果表明，Uni-Retrieval 在大多数检索任务中优于现有的检索模型。这一进展为多样化的教育需求提供了一个可扩展且精确的解决方案。