摘要
arXiv:2504.21049v1 宣告类型: cross
摘要: 套取个人信息的攻击威胁在线用户,通常会导致数据泄露、财务损失和身份盗窃。传统的钓鱼检测系统面临着高误报率的问题,并且通常受到它们能识别的攻击类型的限制。本文提出了一种基于深度学习的方法,使用双向长短期记忆(Bi-LSTM)网络将URL分类为四种类别:良性、钓鱼、篡改和恶意软件。该模型利用了序列URL数据并捕捉上下文信息,提高了钓鱼检测的准确性。在包含超过650,000个URL的数据集上进行的实验结果表明,该模型的有效性,准确率为97%,并显著优于传统技术。