LLM2D
智能电表数据缺口的填补:统计模型、机器学习模型和时间序列基础模型的基准比较
Bridging Smart Meter Gaps: A Benchmark of Statistical, Machine Learning and Time Series Foundation Models for Data Imputation
作者: Amir Sartipi, Joaqu\'in Delgado Fern\'andez, Sergio Potenciano Menci, Alessio Magitteri
发布日期: 2/21/2025
arXiv ID: oai:arXiv.org:2501.07276v2

摘要

arXiv:2501.07276v2 通告类型: 重传 摘要:智能电网中时间序列数据的完整性经常因传感器故障、传输错误或中断而受到损害。智能电表数据中的缺失值可能导致消耗分析发生偏差,妨碍可靠的预测,导致技术性和经济性的低效率。随着智能电表数据的体积和复杂性不断增加,传统的技术方法难以应对其非线性和非平稳的模式。在这个背景下,生成型人工智能提供了可能超越传统统计方法的解决方案。在本文中,我们评估了两种通用的大语言模型和五种时间序列基础模型在智能电表数据插补中的性能,并将它们与传统的机器学习和统计模型进行了比较。我们通过在匿名公开数据集中引入人工缺口(30分钟至一天不等)来测试推理能力。结果显示,具有情境理解和模式识别能力的时间序列基础模型在某些情况下能够显著提高插补准确性。然而,计算成本与性能提升之间的权衡仍然是一个关键考虑因素。