LLM2D

摘要

在快速发展的网站可靠性工程 (SRE) 领域，对高效且有效的解决方案的需求至关重要，这些解决方案可以用于管理和解决网站和云应用程序中的问题。本文提出了一种使用大型语言模型 (LLMs) 进行脚本生成、评估和改进的行动自动化创新方法。通过利用 LLMs 的能力，我们旨在显著减少编写和调试脚本所需的人工工作量，从而提高 SRE 团队的生产力。我们的实验重点是 Bash 脚本，这是一种 SRE 中常用的工具，涉及 CodeSift 数据集的 100 个任务和 InterCode 数据集的 153 个任务。结果表明，LLMs 可以自动高效地评估和改进脚本，从而减少在执行环境中进行脚本验证的需要。结果表明，该框架在脚本生成方面总体提高了 7-10%。