LLM2D

摘要

arXiv:2412.04060v2 宣告类型: 替换摘要: 扩展现有的学习系统以为更多的领域，例如新用户，提供高质量的定制模型，面临着标注数据有限以及数据和设备异构性的挑战。虽然知识蒸馏方法可以克服标签稀缺和设备异构性的问题，但它们假设老师的模型完全可靠，并忽视了数据异构性，这阻碍了现有模型的直接应用。为了解决这一问题，本文提出了一种框架 HaT 以扩展学习系统。该框架首先以低成本从系统中选择多个高质量的模型，然后通过为它们的预测分配样本级别的权重来融合它们的知识。之后，基于知识的质量，选择性地将融合的知识注入到定制模型中。在不同任务、模式和设置下的广泛实验表明，与最先进的基线相比，HaT 的准确率提高了最多 16.5%，通信流量节省了最多 39%。