LLM2D

摘要

arXiv:2505.00034v2 更新类型: 交叉更新摘要: 大型语言模型(LLMs)在许多自然语言处理(NLP)任务中表现出色，并被应用于钓鱼邮件检测研究。然而，在当前的研究中，高性能的LLMs通常包含数十亿甚至几十亿的参数，需要巨大的计算资源。为了降低成本，我们研究了小参数量的LLMs在钓鱼邮件检测中的有效性。这些LLMs约有30亿个参数，并且可以在消费级GPU上运行。然而，小LLMs在钓鱼邮件检测任务中常常表现不佳。为了解决这些问题，我们设计了一套包括提示工程、解释增强微调和模型集成的方法，以提高小LLMs在钓鱼邮件检测方面的性能。我们通过实验验证了我们方法的有效性，在SpamAssassin和CEAS_08数据集上显著提高了准确率和F1分数。此外，微调后的模型展示了较强的知识迁移能力，能够在多个未见过的钓鱼数据集上实现稳健的性能，超过了传统的基线并接近标准规模的LLMs。