LLM2D

摘要

arXiv:2409.16559v2 通知类型: 替换-交叉摘要：随着大规模语言模型（LLMs）的进步，越来越多的开源软件项目将其作为核心功能组件。尽管对LLMs的研究和实践引起了广泛关注，但尚未有专门的研究探讨LLM开源项目实践者的所面临的挑战、这些挑战的原因以及潜在的解决方案。为了填补这一研究空白，我们开展了一项实证研究，以理解在开发和使用LLM开源软件时实践者遇到的问题、这些问题的可能原因以及潜在解决方案。我们收集了15个LLM开源项目的全部已关闭问题，并对符合要求的问题进行了标注。然后，我们从已标注的问题中随机选取了994个问题作为数据提取和分析的样本，以了解常见的问题、其潜在的原因以及可能的解决方案。我们的研究结果表明：（1）模型问题是最常见的问题；（2）模型问题、配置和连接问题以及功能和方法问题是这些问题最常见的原因；（3）优化模型是对这些问题的主要解决方案。根据研究结果，我们为LLM开源项目的研究人员和实践者提供了相应的建议。