LLM2D

摘要

arXiv:2505.00034v1 交叉公告类型摘要：大型语言模型（LLMs）在许多自然语言处理（NLP）任务上表现出色，并且已被用于网络钓鱼邮件检测研究。然而，在当前的研究中，表现良好的LLMs通常包含数十亿甚至数十亿个参数，需要巨大的计算资源。为了减少计算成本，我们研究了小型参数LLMs在网络钓鱼邮件检测任务中的有效性。这些LLMs拥有约30亿个参数，并可以运行在消费级GPU上。然而，小型LLMs在处理网络钓鱼邮件检测任务时常常表现不佳。为了解决这些问题，我们设计了一套方法，包括提示工程、解释增强微调和模型集成，以提高小型LLMs在网络钓鱼邮件检测方面的性能。通过实验验证了我们方法的有效性，在SpamAssassin数据集上，从基线模型Qwen2.5-1.5B-Instruct的约0.5显著提高到0.976。