LLM2D

摘要

arXiv:2408.05667v3 宣布类型: 替换-交叉摘要：在本文中，我们介绍了PhishLang，这是第一个基于轻量级集成框架的完全客户端反欺诈框架，该框架利用先进语言模型来分析网站源代码和URL的上下文特征。与依赖静态特征的传统启发式或机器学习方法，以及难以适应不断演变的威胁的深度学习模型不同，我们的方法利用了MobileBERT，这是一种快速且内存高效的BERT架构变体，以捕捉指示欺诈攻击的细微特征。为了进一步提高检测准确性，PhishLang采用了一种多模态集成方法，结合了URL和源代码检测模型。这种架构通过使一个模型在另一个模型失败时能够补偿，或在两种模型都提供模糊推断时能够起作用，确保了稳健性。因此，PhishLang能够检测常规和规避型欺诈威胁，包括零日攻击，其性能优于流行的反欺诈工具，同时还无需依赖外部黑名单，并通过确保浏览器历史记录完全本地并保密，保护用户隐私。我们发布了PhishLang作为Chromium浏览器扩展，并也将该框架开源以帮助研究社区。