LLM2D

摘要

arXiv:2504.03686v1 宣布类型：交叉摘要：第六代（6G）移动网络的一个关键任务是在网络边缘部署大规模人工智能（AI）模型，为边缘设备提供远程推理服务。由此产生的平台，称为边缘推理，将支持诸如自动驾驶、工业自动化和增强现实等广泛的物联网应用。鉴于这些任务的至关重要性和时间敏感性，设计既可靠又能够满足严格的端到端（E2E）延迟约束的边缘推理系统至关重要。现有研究主要关注通过信道中断概率表征的通信可靠性，可能无法保证E2E性能，特别是从E2E推理准确度和延迟方面。为了解决这一局限性，我们提出了一种理论框架，引入并从数学上对推理中断（InfOut）概率进行了表征，量化了端到端推理准确度低于目标阈值的可能性。在E2E延迟约束下，该框架建立了通信开销（即上传更多的传感器观测值）与由InfOut概率表征的推理可靠性之间的基本权衡。为了找到优化这一权衡的关系的可处理方法，我们通过对接收判别增益分布应用高斯近似，推导出了InfOut概率的准确替代函数。实验结果表明，与传统的通信中心方法相比，所提出的方案在E2E推理可靠性方面更为优越。