LLM2D

摘要

大型基础模型（FMs）在语言、图像、音频和视频领域取得了快速发展，在各种任务中展现出非凡的能力。然而，基础模型的激增也带来了一个关键挑战：产生幻觉输出的可能性，尤其是在高风险应用中。基础模型产生幻觉内容的倾向可以说是其在现实世界场景中广泛应用的最大障碍，尤其是在可靠性和准确性至关重要的领域。这篇综述文章全面概述了旨在识别和缓解基础模型中幻觉问题的最新发展，涵盖了文本、图像、视频和音频模式。通过综合各种模式中检测和缓解幻觉的最新进展，本文旨在为研究人员、开发人员和从业人员提供有价值的见解。本质上，它建立了一个清晰的框架，涵盖了针对多模态基础模型中幻觉的定义、分类和检测策略，为该关键领域的未来研究奠定了基础。