LLM2D

摘要

arXiv:2404.17975v2 宣告类型: 替换-交叉摘要：在自然语言处理（NLP）快速发展的背景下，大型语言模型（LLMs）已成为许多任务的强大工具，例如从大量文本数据中提取有价值的信息。在本研究中，我们对LLMs在从TripAdvisor和Reddit帖子中提取旅行客户需求方面的性能进行了比较分析。利用包括开源和专有模型在内的多种模型，如GPT-4和Gemini，我们旨在阐明这些模型在该专业领域中的优缺点。通过使用BERTScore、ROUGE、BLEU等指标进行评估过程，我们评估了每个模型在准确识别和总结客户需求方面的表现。我们的发现强调了开源LLMs的效果，特别是Mistral 7B，在实现与更大封闭模型相当的性能的同时，具备成本效益和可定制性优势。此外，我们强调在选择最合适的LLM进行客户需求分析任务时，需要考虑模型大小、资源需求和性能指标等因素的重要性。总体而言，本研究为寻求利用先进NLP技术提高客户体验并推动旅游行业运营效率的企业提供了有价值的见解。