LLM2D
2025年哥谭数据集:一个可用于入侵检测和安全研究的可再现大规模物联网网络数据集
Gotham Dataset 2025: A Reproducible Large-Scale IoT Network Dataset for Intrusion Detection and Security Research
作者: Othmane Belarbi, Theodoros Spyridopoulos, Eirini Anthi, Omer Rana, Pietro Carnelli, Aftab Khan
发布日期: 2/6/2025
arXiv ID: oai:arXiv.org:2502.03134v1

摘要

arXiv:2502.03134v1 交叉公告类型:cross 摘要:在本文中,我们介绍了物联网网络流量的数据集。我们的数据集利用了Gotham测试床生成,这是一个模拟的大规模物联网(IoT)网络,旨在为网络安全性研究提供一种现实且多变的环境。该测试床包括78个运行在各种协议上的仿物联网设备,包括MQTT、CoAP和RTSP。网络流量使用tcpdump以Packet Capture (PCAP)格式捕获,并记录了正常和恶意流量。恶意流量通过脚本攻击生成,涵盖了多种形式的攻击类型,如拒绝服务(DoS)、Telnet暴力破解、网络扫描、CoAP放大和各种阶段的命令和控制(C&C)通信。数据随后使用Tshark工具在Python中进行处理以提取特征,结果数据被转换为逗号分隔值(CSV)格式并进行了标记。数据仓库包括以PCAP格式存在的原始网络流量以及以CSV格式存在的标记化数据。我们的数据集是分布式收集的,网络流量在物联网网关与设备之间的接口处独立地为每个物联网设备进行了捕获。随着其多样化的流量模式和攻击场景,该数据集为开发适用于复杂大规模物联网环境的入侵检测系统和安全机制提供了宝贵的资源。该数据集已在Zenodo上公开。