摘要
arXiv:2505.00034v2 更新类型: 交叉更新
摘要: 大型语言模型(LLMs)在许多自然语言处理(NLP)任务中表现出色,并被应用于钓鱼邮件检测研究。然而,在当前的研究中,高性能的LLMs通常包含数十亿甚至几十亿的参数,需要巨大的计算资源。为了降低成本,我们研究了小参数量的LLMs在钓鱼邮件检测中的有效性。这些LLMs约有30亿个参数,并且可以在消费级GPU上运行。然而,小LLMs在钓鱼邮件检测任务中常常表现不佳。为了解决这些问题,我们设计了一套包括提示工程、解释增强微调和模型集成的方法,以提高小LLMs在钓鱼邮件检测方面的性能。我们通过实验验证了我们方法的有效性,在SpamAssassin和CEAS_08数据集上显著提高了准确率和F1分数。此外,微调后的模型展示了较强的知识迁移能力,能够在多个未见过的钓鱼数据集上实现稳健的性能,超过了传统的基线并接近标准规模的LLMs。