LLM2D
超越请求:在不平衡环境中利用HTTP响应头进行跨浏览器网页追踪器分类
Beyond the Request: Harnessing HTTP Response Headers for Cross-Browser Web Tracker Classification in an Imbalanced Setting
发布日期: 9/24/2024
arXiv ID: oai:arXiv.org:2402.01240v3

摘要

万维网的连接性很大程度上归功于HTTP协议,HTTP消息提供的信息头字段在网络安全和隐私保护等领域,特别是网络追踪方面,具有重要作用。尽管现有研究利用HTTP请求消息来识别网络追踪器,但HTTP响应头常被忽视。本研究旨在通过二值化的HTTP响应头设计有效的机器学习分类器来检测网络追踪器。我们利用通过流量监控浏览器扩展T.EX从Chrome、Firefox和Brave浏览器中获取的数据作为数据集。十个监督模型在Chrome数据上训练,并在所有浏览器上测试,包括一年后获取的Chrome数据集。结果显示,Chrome和Firefox的准确率、F1分数、精确度、召回率和最小对数损失误差都很高,但在Brave上的表现较差,这可能是由于其数据分布和特征集的不同所致。研究表明这些分类器在网络追踪器检测中是可行的。然而,实际应用测试尚未进行,未来研究可以探讨追踪器类型的区分和更广泛的标签来源。