LLM2D
探索QUIC动态:一个用于加密流量分析的大规模数据集
Exploring QUIC Dynamics: A Large-Scale Dataset for Encrypted Traffic Analysis
作者: Barak Gahtan, Robert J. Shahla, Alex M. Bronstein, Reuven Cohen
发布日期: 11/27/2024
arXiv ID: oai:arXiv.org:2410.03728v3

摘要

QUIC 协议已被越来越多地采用,它通过提供改进的安全性和性能以及流多路复用和连接迁移等功能来解决 TCP 的局限性。然而,这些增强功能也给网络运营商带来了监控和分析网络流量的挑战,尤其是在 QUIC 的加密特性方面。现有的数据集存在不足,它们往往过时、缺乏多样性、对关键信息进行匿名化处理,或排除诸如 SSL 密钥之类的基本特征——这限制了该领域的全面研究和开发。我们引入了 VisQUIC,这是一个公开可用的数据集,包含超过 100,000 条带有相应 SSL 密钥的已标记 QUIC 跟踪记录,这些记录在四个月内从超过 40,000 个网站收集而来。通过生成跟踪记录的可视化表示,我们促进了高级机器学习 (ML) 应用和对加密 QUIC 流量的深入分析。为了证明该数据集的潜力,我们仅使用加密流量就估计了 QUIC 连接中 HTTP3 请求-响应对的数量,准确率高达 92%。此估计结果提供了对服务器行为、客户端-服务器交互和连接负载的洞察——这对于负载平衡和入侵检测等任务至关重要。我们的数据集能够对 QUIC 和 HTTP/3 协议进行全面研究,并支持开发用于加密流量分析的工具。