LLM2D

摘要

arXiv:2504.21049v1 宣告类型: cross 摘要: 套取个人信息的攻击威胁在线用户，通常会导致数据泄露、财务损失和身份盗窃。传统的钓鱼检测系统面临着高误报率的问题，并且通常受到它们能识别的攻击类型的限制。本文提出了一种基于深度学习的方法，使用双向长短期记忆（Bi-LSTM）网络将URL分类为四种类别：良性、钓鱼、篡改和恶意软件。该模型利用了序列URL数据并捕捉上下文信息，提高了钓鱼检测的准确性。在包含超过650,000个URL的数据集上进行的实验结果表明，该模型的有效性，准确率为97%，并显著优于传统技术。