摘要
arXiv:2501.17479v2 通知类型: 替换-交叉
摘要:大规模语言模型(LLMs)在各种自然语言处理任务中展示了出色的能力,但在多样或复杂的领域中往往难以实现全面卓越。我们提出了一种新颖的集成方法——多样指纹集成(DFPE),该方法结合多个LLM的互补优点以实现更稳健的性能。我们的方法包括:(1)基于响应“指纹”模式对模型进行聚类,(2)应用基于分位数的筛选机制,以在每个主题级别去除表现不佳的模型,以及(3)基于其主题内验证准确性为剩余模型分配自适应权重。在大规模多任务语言理解(MMLU)基准测试中,DFPE的整体准确性和学科级别的准确率分别比最佳单个模型高出3%和5%。该方法提高了LLMs的稳健性和泛化能力,并强调了模型选择、多样性的保持以及基于性能的权重分配如何有效地应对多方面、具有挑战性的语言理解任务。