LLM2D

摘要

随着大型语言模型 (LLM) 的发展，越来越多的开源软件项目将 LLM 作为其核心功能组件。尽管 LLM 的研究和实践引起了相当大的兴趣，但目前还没有专门的研究探讨 LLM 开源项目实践者面临的挑战、这些挑战的原因以及潜在的解决方案。为了填补这一研究空白，我们进行了一项实证研究，以了解实践者在开发和使用 LLM 开源软件时遇到的问题、这些问题可能的原因以及潜在的解决方案。我们收集了 15 个 LLM 开源项目的全部已关闭问题，并标记了符合我们要求的问题。然后，我们从标记的问题中随机选择了 994 个问题作为数据提取和分析的样本，以了解普遍存在的问题、其根本原因和潜在的解决方案。我们的研究结果表明：（1）模型问题是实践者面临的最常见问题；（2）模型问题、配置和连接问题以及功能和方法问题是识别出的最常见问题原因；（3）优化模型是解决这些问题的首选方案。基于研究结果，我们为 LLM 开源项目的实践者和研究人员提供了启示。