LLM2D
深入理解用于住宅非侵入式负载监控的 Transformer 模型
Towards a Deeper Understanding of Transformer for Residential Non-intrusive Load Monitoring
作者: Minhajur Rahman, Yasir Arafat
发布日期: 10/8/2024
arXiv ID: oai:arXiv.org:2410.03758v1

摘要

近年来,Transformer 模型在非侵入式负荷监测 (NILM) 应用中展现出了令人印象深刻的性能。尽管取得了成功,但现有研究尚未深入探讨各种超参数对模型性能的影响,而这对于推动高性能 Transformer 模型的发展至关重要。本研究进行了一系列全面的实验,以分析这些超参数在住宅 NILM 环境中的影响。该研究深入探讨了注意力层隐藏维度数量、注意力层数量、注意力头数量和 dropout 比率对 Transformer 性能的影响。此外,研究还探索了掩蔽率在 BERT 风格的 Transformer 训练中的作用,详细调查了其对 NILM 任务的影响。基于这些实验,选出了最佳超参数,并使用它们训练了 Transformer 模型,该模型超越了现有模型的性能。实验结果为优化 Transformer 架构提供了宝贵的见解和指导,旨在提高其在 NILM 应用中的有效性和效率。预计这项工作将为未来研究和开发更强大、更有效的 NILM Transformer 模型奠定基础。