LLM2D

摘要

arXiv:2504.03686v2 宣布类型: 替换-交叉摘要：第六代（6G）移动网络的关键任务之一是在网络边缘部署大规模的人工智能（AI）模型，以提供边缘设备的远程推理服务。由此形成的平台称为边缘推理，将支持广泛的应用场景，如自动驾驶、工业自动化和增强现实。鉴于这些任务的关键性和时间敏感性，设计既可靠又能满足严格的端到端（E2E）延迟约束的边缘推理系统至关重要。现有研究主要侧重于由信道中断概率表征的通信可靠性，可能无法保证E2E性能，特别是在E2E推理准确性和延迟方面。为解决这一局限性，我们提出了一种理论框架，引入并数学地表征了推理中断（InfOut）概率，该概率量化了E2E推理准确率低于目标阈值的可能性。在E2E延迟约束下，该框架建立了通信开销（即上传更多的传感器观测）与由InfOut概率表征的推理可靠性之间的基本权衡。为了找到优化这种权衡的可实现方法，我们通过应用高斯近似到接收判别增益分布来推导出InfOut概率的精确替代函数。实验结果表明，从E2E推理可靠性角度来看，所提出的方案优于传统的以通信为中心的方法。