LLM2D

摘要

arXiv:2501.06066v3 宣 bố loại: replace-cross 摘要：在边缘设备上部署人工智能（AI）模型涉及在满足严格复杂性约束（如有限的内存和能源资源）与确保在敏感决策任务中可靠性能之间取得微妙的平衡。通过贝叶斯推断进行不确定量化是增强可靠性的方法之一。然而，这种方法通常需要维护和运行多个模型进行集成，这可能会超过边缘设备的计算限制。本文通过从复杂模型中蒸馏校准信息提出了一种低复杂度方法来解决这一挑战。在离线阶段，利用基于云的复杂模型生成的预测概率来确定一个阈值，该阈值基于云模型与边缘模型之间的典型偏差。在运行时，使用该阈值构建似然集——在用户选定的置信水平下，能够保证包含云模型预测的概率范围。似然集通过预测概率单纯形上的偏差测度阈值化获得。针对视觉和语言任务的实验表明，所提出的方法——称为相容化蒸馏推断（CD-CI）——与低复杂度贝叶斯方法（如拉普拉斯近似）相比，显著提高了校准性能，使其成为边缘AI部署的实际和高效解决方案。