LLM2D

摘要

arXiv:2502.10497v1 类型: cross 摘要: 近期在生成式人工智能方面的进展显著提高了自然语言处理（NLP）系统的效率和适应性，特别通过检索增强生成（RAG）、低秩适应（LoRA）和权重分解低秩适应（DoRA）。RAG 结合外部知识以增强生成输出的事实一致性，而 LoRA 使得大规模语言模型（LLMs）的参数高效 fine-tuning 成为可能。DoRA 进一步通过自适应参数排名和领域意识的权重调整优化 fine-tuning 过程，从而提高学习效率同时保持推理性能。本文展示了 RAG、LoRA 和 DoRA 的大规模实证评估，模型 fine-tuning 和生成性能在 20,000 个基于 FAQ 的查询上进行评估，而知识库涵盖 400,000 条记录。该研究分析了诸如准确性、相关性和推理延迟等关键性能指标。实验结果表明，DoRA 在准确性（90.1%）、相关性评分（0.88）和最低延迟（每查询 110 毫秒）方面表现出色，在现实世界的领域特定生成式 AI 应用中超越了 LoRA 和 RAG。此外，该研究还探讨了在不同模型中 fine-tuning 效率、计算成本和实时适应性之间的权衡。研究结果强调了 RAG 在知识落地方面的有效性、LoRA 在高效领域适应方面的成本效益，以及 DoRA 在平衡 fine-tuning 效率和模型精度方面的能力。这些见解为在诸如医疗服务、金融和法律服务等高精度领域部署以 AI 驱动的生成系统提供了实用指导，确保在动态环境中实现可扩展性、可靠性和最佳性能。