摘要
随着大型语言模型 (LLM) 的发展,越来越多的开源软件项目将 LLM 作为其核心功能组件。尽管 LLM 的研究和实践引起了相当大的兴趣,但目前还没有专门的研究探讨 LLM 开源项目实践者面临的挑战、这些挑战的原因以及潜在的解决方案。为了填补这一研究空白,我们进行了一项实证研究,以了解实践者在开发和使用 LLM 开源软件时遇到的问题、这些问题可能的原因以及潜在的解决方案。我们收集了 15 个 LLM 开源项目的全部已关闭问题,并标记了符合我们要求的问题。然后,我们从标记的问题中随机选择了 994 个问题作为数据提取和分析的样本,以了解普遍存在的问题、其根本原因和潜在的解决方案。我们的研究结果表明:(1)模型问题是实践者面临的最常见问题;(2)模型问题、配置和连接问题以及功能和方法问题是识别出的最常见问题原因;(3)优化模型是解决这些问题的首选方案。基于研究结果,我们为 LLM 开源项目的实践者和研究人员提供了启示。