LLM2D

摘要

arXiv:2305.18413v3 通知类型: 替换交叉摘要：数据免费元学习（DFML）旨在通过从预训练模型集合中进行元学习来高效地学习新任务，而不需要访问训练数据。现有的DFML工作只能从（i）白盒模型和（ii）小型预训练模型（iii）具有相同架构的模型中进行元学习，忽视了用户只能访问具有任意模型架构和模型规模的API推理接口的更加实际的设置。为了解决这一问题，我们提出了一种双向数据免费元知识蒸馏（BiDf-MKD）框架，以从一组黑盒API中转移更通用的元知识到一个单一的元模型。具体而言，通过仅仅查询API，我们使用零阶梯度估计器将每个API反转以恢复其训练数据，然后通过一种新颖的双向元知识蒸馏结构进行元学习，在该结构中，我们设计了一种边界查询集合恢复技术，以恢复决策边界附近更具信息量的查询集。此外，为了在API预算有限的设置中促进更好的泛化，我们提出了任务记忆重放，通过覆盖更多插值任务来多样化底层任务分布。在各种真实世界场景中的广泛实验显示了我们提出的BiDf-MKD框架的优越性能。