LLM2D

摘要

arXiv:2501.17479v2 通知类型: 替换-交叉摘要：大规模语言模型（LLMs）在各种自然语言处理任务中展示了出色的能力，但在多样或复杂的领域中往往难以实现全面卓越。我们提出了一种新颖的集成方法——多样指纹集成（DFPE），该方法结合多个LLM的互补优点以实现更稳健的性能。我们的方法包括：（1）基于响应“指纹”模式对模型进行聚类，（2）应用基于分位数的筛选机制，以在每个主题级别去除表现不佳的模型，以及（3）基于其主题内验证准确性为剩余模型分配自适应权重。在大规模多任务语言理解（MMLU）基准测试中，DFPE的整体准确性和学科级别的准确率分别比最佳单个模型高出3%和5%。该方法提高了LLMs的稳健性和泛化能力，并强调了模型选择、多样性的保持以及基于性能的权重分配如何有效地应对多方面、具有挑战性的语言理解任务。