摘要
网络流量异常检测对于维护计算机网络安全和识别恶意活动至关重要。基于预测的方法是异常检测的主要方法之一。然而,缺乏用于预测和异常检测技术的真实世界网络数据集,可能会导致异常检测算法性能过高估计。本文通过引入一个包含网络实体行为时间序列数据的数据集来解决这一差距,该数据集从 CESNET3 网络收集而来。该数据集由 275,000 个活跃 IP 地址的 40 周网络流量创建。该数据来自互联网服务提供商,确保网络实体之间具有高度的变异性,这为预测和异常检测模型带来了独特的真实挑战。它为基于预测的异常检测方法的实际部署提供了宝贵的见解。