LLM2D
揭开大型语言模型开源项目中问题、原因及解决方案的神秘面纱
Demystifying Issues, Causes and Solutions in LLM Open-Source Projects
作者: Yangxiao Cai, Peng Liang, Yifei Wang, Zengyang Li, Mojtaba Shahin
发布日期: 4/8/2025
arXiv ID: oai:arXiv.org:2409.16559v2

摘要

arXiv:2409.16559v2 通知类型: 替换-交叉 摘要:随着大规模语言模型(LLMs)的进步,越来越多的开源软件项目将其作为核心功能组件。尽管对LLMs的研究和实践引起了广泛关注,但尚未有专门的研究探讨LLM开源项目实践者的所面临的挑战、这些挑战的原因以及潜在的解决方案。为了填补这一研究空白,我们开展了一项实证研究,以理解在开发和使用LLM开源软件时实践者遇到的问题、这些问题的可能原因以及潜在解决方案。我们收集了15个LLM开源项目的全部已关闭问题,并对符合要求的问题进行了标注。然后,我们从已标注的问题中随机选取了994个问题作为数据提取和分析的样本,以了解常见的问题、其潜在的原因以及可能的解决方案。我们的研究结果表明:(1)模型问题是最常见的问题;(2)模型问题、配置和连接问题以及功能和方法问题是这些问题最常见的原因;(3)优化模型是对这些问题的主要解决方案。根据研究结果,我们为LLM开源项目的研究人员和实践者提供了相应的建议。