摘要
传统上,汽车行业软件部署决策通常依赖于对表格化软件测试数据的分析。由于人工密集,这种方法往往会导致软件发布周期成本更高、时间更长。大型语言模型 (LLM) 为这些挑战提供了一个有前景的解决方案。然而,它们的应用通常需要多轮人工驱动的提示工程,这限制了它们的实际部署,特别是对于需要可靠且高效结果的工业终端用户而言。本文提出 GoNoGo,一个旨在简化汽车软件部署并同时满足功能要求和实际工业约束的 LLM 代理系统。与之前的系统不同,GoNoGo 专为解决特定领域和风险敏感系统而设计。我们使用来自工业实践的零样本和少样本示例,评估了 GoNoGo 在不同任务难度下的性能。结果表明,GoNoGo 在使用 3 个样本的情况下,对于难度等级不超过 2 级 的任务,成功率达到 100%,即使对于更复杂的任务,也保持着高性能。我们发现,GoNoGo 有效地自动化了对简单任务的决策,从而显著减少了人工干预的需要。总之,GoNoGo 代表了一种高效且用户友好的基于 LLM 的解决方案,目前已在我们工业合作伙伴公司中使用,以协助软件发布决策,为风险敏感的车辆系统发布过程提供更明智和及时的决策。