摘要
arXiv:2503.17167v2 宣告类型: replace-cross
摘要:隐私限制阻碍了真实世界水管网络(WDN)模型的共享,限制了新兴数据驱动机器学习的应用,这些机器学习方法通常需要大量的观察数据。为了应对这一挑战,我们提出了包含36,000个独特场景的数据集DiTEC-WDN,这些场景在短期(24小时)或长期(一年)期间进行了模拟。我们使用了一个自动化的工作流来优化关键参数(例如压力、流量和需求模式),促进大规模模拟,并通过规则验证和事后分析记录了在标准条件下的离散、合成但符合水力现实状态的图状状态。DiTEC-WDN总共生成了2.28亿个图基状态,可以支持各种机器学习任务,包括图级别、节点级别和连接级别回归,以及时间序列预测。该贡献在公共许可证下发布,鼓励了水关键领域中的开放科学研究,消除了暴露敏感数据的风险,并满足了研究比较和场景分析所需的大规模水管网络基准数据集的需求。