摘要
arXiv:2505.07553v1 类别: cross
摘要:这篇简短的文章探讨了一家海运公司在开发和集成大语言模型(LLM)方面的进展。通过具体研究专家环境中的检索增强生成(RAG)系统的软件工程需求,展示了数据科学家在满足用户对AI完美性的期望与生成输出的正确性之间面临的基本张力。通过一项海运服务提供商的案例研究,我们的发现揭示了数据科学家必须通过与用户的迭代实验来识别特定于上下文的“检索需求”,因为他们有能力确定正确性。我们提出了一个实证过程模型,描述了数据科学家如何实际引出这些“检索需求”并在管理系统限制的同时处理它们。这项工作通过提供有关在复杂领域特定应用程序中实施RAG系统的特殊软件工程需求工程过程的见解,推动了软件工程知识的发展。