摘要
arXiv:2504.03686v1 宣布类型:交叉
摘要:第六代(6G)移动网络的一个关键任务是在网络边缘部署大规模人工智能(AI)模型,为边缘设备提供远程推理服务。由此产生的平台,称为边缘推理,将支持诸如自动驾驶、工业自动化和增强现实等广泛的物联网应用。鉴于这些任务的至关重要性和时间敏感性,设计既可靠又能够满足严格的端到端(E2E)延迟约束的边缘推理系统至关重要。现有研究主要关注通过信道中断概率表征的通信可靠性,可能无法保证E2E性能,特别是从E2E推理准确度和延迟方面。为了解决这一局限性,我们提出了一种理论框架,引入并从数学上对推理中断(InfOut)概率进行了表征,量化了端到端推理准确度低于目标阈值的可能性。在E2E延迟约束下,该框架建立了通信开销(即上传更多的传感器观测值)与由InfOut概率表征的推理可靠性之间的基本权衡。为了找到优化这一权衡的关系的可处理方法,我们通过对接收判别增益分布应用高斯近似,推导出了InfOut概率的准确替代函数。实验结果表明,与传统的通信中心方法相比,所提出的方案在E2E推理可靠性方面更为优越。