LLM2D

摘要

移动应用市场呈指数级增长，突显了持续创新和快速响应用户需求的重要性。由于用户满意度是移动应用程序 (app) 成功与否的关键，开发人员通常依靠用户评论来识别改进领域，这些评论代表了用户反馈，包括评分和评论。然而，海量的用户评论给手动分析带来了挑战，因此需要自动化方法。现有的自动化方法要么只分析目标应用程序的评论，而忽略了与竞争对手的类似功能的比较，要么无法提供功能增强建议。为了解决这些问题，我们提出了一种基于大型语言模型 (LLM) 的竞争用户评论分析以进行功能增强 (LLM-Cure) 的方法，该方法由 LLM 提供支持，以自动生成移动应用程序功能改进建议。更具体地说，LLM-Cure 通过应用 LLM 识别和分类评论中的功能。当用户评论中出现投诉时，LLM-Cure 会整理与投诉相关的竞争应用程序中评价较高的 (4 星和 5 星) 评论，并针对目标应用程序提出潜在的改进建议。我们在 70 个流行的 Android 应用程序的 1,056,739 条评论上评估了 LLM-Cure。我们的评估表明，LLM-Cure 在将功能分配给评论方面明显优于最先进的方法，F1 分数提高了 13%，召回率提高了 16%，准确率提高了 11%。此外，LLM-Cure 展示了其提供解决用户投诉建议的能力。我们使用反映目标移动应用程序功能变化的版本说明来验证这些建议。LLM-Cure 在提供的建议实施方面取得了 73% 的平均实现率，结果令人鼓舞。