摘要
arXiv:2409.13707v1 公告类型: 交叉 摘要: 希望在IT支持和AIOps领域实施生成式AI的客户面临两个关键问题:领域覆盖范围和模型大小限制,这是由于模型选择的局限性。客户可能出于成本和隐私考虑,选择不使用GPT-4等较大的专有模型,因此只能使用可能领域覆盖范围较小、无法泛化到客户领域的小型模型。检索增强生成是一种常见的解决方案,可以解决这两个问题:检索系统首先检索必要的领域知识,然后小型生成模型利用这些知识作为上下文进行生成。我们为IT支持领域的客户开发了一个系统,用于支持案例解决方案推荐,该系统结合了检索增强生成(RAG)用于答案生成,编码器模型用于分类,以及生成式大型语言模型用于查询生成。我们涵盖了架构细节、数据收集和标注、开发历程和初步验证、预期的最终部署流程和评估计划,最后总结了经验教训。