摘要
arXiv:2505.07045v1 交叉公告类型:交叉学科
摘要:基于强化学习(RL)的供暖、通风和空调(HVAC)控制技术已经成为了减少建筑能耗、同时保持室内热舒适的一种有前景的技术。然而,这些策略的有效性受到背景气候的影响,其实施可能潜在地改变室内气候和局部城市气候。本研究提出了一种结合RL与城市气候模型的集成框架,该模型包含了建筑能源模型,旨在评估不同背景气候下基于RL的HVAC控制的有效性、RL策略对室内气候和局部城市气候的影响,以及RL策略在不同城市之间的可转移性。我们的研究结果表明,奖励(定义为能耗和热舒适性的加权组合)以及RL策略对室内气候和局部城市气候的影响在不同背景气候的城市中表现出明显的差异。奖励权重的敏感性和RL策略的可转移性也强烈受背景气候的影响。在平衡能耗和热舒适性的奖励权重配置中,处于热气候中的城市通常能够获得更高的奖励,而那些大气温度变化较大的城市表现出更高的RL策略可转移性。这些研究结果强调了在不同气候背景下彻底评估基于RL的HVAC控制策略的重要性。这项研究还提供了一种新的见解,即城市间的学习可能会有助于基于RL的HVAC控制的应用部署。