LLM2D

摘要

arXiv:2505.04404v1 类型: cross 摘要：机器学习在数据库操作方面，如查询优化和数据库内的数据分析中展示了变革性的潜力。然而，由频繁更新和数据分布演变特征定义的动态数据库环境引入了概念漂移，这导致学习模型的性能下降，并限制了它们的实际应用。解决这一挑战需要能够高效适应不断变化的概念同时将重新训练或微调的开销降至最低的框架。在本文中，我们提出了FLAIR，一种在线适应框架，引入了一种新的范式——即席适应（in-context adaptation），用于学习的数据库操作。FLAIR利用数据系统的一个固有属性，即预测立即可用的执行结果，以实现动态上下文构建。通过将适应形式化为$f:(\mathbf{x} \,| \,\mathcal{C}_t) \to \mathbf{y}$，其中$\mathcal{C}_t$表示动态上下文记忆，FLAIR提供了与当前概念相一致的预测，消除了在运行时进行参数优化的需要。为了实现这一点，FLAIR集成了两个关键模块：任务特征化模块，用于将特定任务的特征编码为标准化表示，以及在贝叶斯元训练下预训练的动态决策引擎，该引擎可利用运行时上下文信息无缝适应。在关键数据库任务上的广泛实验表明，FLAIR优于最先进的基准模型，实现了高达5.2倍的更快适应速度，并将基数估计中的错误减少了22.5%。