LLM2D
大规模语言模型策略在心理健康文本分析中的系统评估:微调 vs. 提示工程 vs. RAG
A Systematic Evaluation of LLM Strategies for Mental Health Text Analysis: Fine-tuning vs. Prompt Engineering vs. RAG
作者: Arshia Kermani, Veronica Perez-Rosas, Vangelis Metsis
发布日期: 4/1/2025
arXiv ID: oai:arXiv.org:2503.24307v1

摘要

arXiv:2503.24307v1 类型:跨领域 摘要:本研究对使用大型语言模型(LLMs)进行心理健康文本分析的三种方法进行了系统比较:提示工程、检索增强生成(RAG)和微调。使用 LLaMA 3,我们在两个数据集上评估了这些方法在情绪分类和心理健康状况检测任务中的表现。微调在情绪分类(91%的准确率)和心理健康状况(80%的准确率)方面表现最佳,但需要大量的计算资源和大规模的训练集,而提示工程和RAG则提供了较为灵活的部署方式,尽管性能中等(40-68%的准确率)。我们的研究结果为心理健康应用中实施基于LLM的解决方案提供了实用的见解,突出了准确性、计算资源需求和部署灵活性之间的权衡。