摘要
arXiv:2505.00034v1 交叉公告类型
摘要:大型语言模型(LLMs)在许多自然语言处理(NLP)任务上表现出色,并且已被用于网络钓鱼邮件检测研究。然而,在当前的研究中,表现良好的LLMs通常包含数十亿甚至数十亿个参数,需要巨大的计算资源。为了减少计算成本,我们研究了小型参数LLMs在网络钓鱼邮件检测任务中的有效性。这些LLMs拥有约30亿个参数,并可以运行在消费级GPU上。然而,小型LLMs在处理网络钓鱼邮件检测任务时常常表现不佳。为了解决这些问题,我们设计了一套方法,包括提示工程、解释增强微调和模型集成,以提高小型LLMs在网络钓鱼邮件检测方面的性能。通过实验验证了我们方法的有效性,在SpamAssassin数据集上,从基线模型Qwen2.5-1.5B-Instruct的约0.5显著提高到0.976。