摘要
arXiv:2504.03686v2 宣布类型: 替换-交叉
摘要:第六代(6G)移动网络的关键任务之一是在网络边缘部署大规模的人工智能(AI)模型,以提供边缘设备的远程推理服务。由此形成的平台称为边缘推理,将支持广泛的应用场景,如自动驾驶、工业自动化和增强现实。鉴于这些任务的关键性和时间敏感性,设计既可靠又能满足严格的端到端(E2E)延迟约束的边缘推理系统至关重要。现有研究主要侧重于由信道中断概率表征的通信可靠性,可能无法保证E2E性能,特别是在E2E推理准确性和延迟方面。为解决这一局限性,我们提出了一种理论框架,引入并数学地表征了推理中断(InfOut)概率,该概率量化了E2E推理准确率低于目标阈值的可能性。在E2E延迟约束下,该框架建立了通信开销(即上传更多的传感器观测)与由InfOut概率表征的推理可靠性之间的基本权衡。为了找到优化这种权衡的可实现方法,我们通过应用高斯近似到接收判别增益分布来推导出InfOut概率的精确替代函数。实验结果表明,从E2E推理可靠性角度来看,所提出的方案优于传统的以通信为中心的方法。