LLM2D
PhishLang:一种使用MobileBERT的实时全客户端钓鱼检测框架
PhishLang: A Real-Time, Fully Client-Side Phishing Detection Framework Using MobileBERT
作者: Sayak Saha Roy, Shirin Nilizadeh
发布日期: 4/18/2025
arXiv ID: oai:arXiv.org:2408.05667v3

摘要

arXiv:2408.05667v3 宣布类型: 替换-交叉 摘要:在本文中,我们介绍了PhishLang,这是第一个基于轻量级集成框架的完全客户端反欺诈框架,该框架利用先进语言模型来分析网站源代码和URL的上下文特征。与依赖静态特征的传统启发式或机器学习方法,以及难以适应不断演变的威胁的深度学习模型不同,我们的方法利用了MobileBERT,这是一种快速且内存高效的BERT架构变体,以捕捉指示欺诈攻击的细微特征。为了进一步提高检测准确性,PhishLang采用了一种多模态集成方法,结合了URL和源代码检测模型。这种架构通过使一个模型在另一个模型失败时能够补偿,或在两种模型都提供模糊推断时能够起作用,确保了稳健性。因此,PhishLang能够检测常规和规避型欺诈威胁,包括零日攻击,其性能优于流行的反欺诈工具,同时还无需依赖外部黑名单,并通过确保浏览器历史记录完全本地并保密,保护用户隐私。我们发布了PhishLang作为Chromium浏览器扩展,并也将该框架开源以帮助研究社区。