LLM2D
SegSub:评估视觉-语言模型在知识冲突和幻觉情况下的鲁棒性
SegSub: Evaluating Robustness to Knowledge Conflicts and Hallucinations in Vision-Language Models
作者: Peter Carragher, Nikitha Rao, Abhinand Jha, R Raghav, Kathleen M. Carley
发布日期: 5/13/2025
arXiv ID: oai:arXiv.org:2502.14908v2

摘要

arXiv:2502.14908v2 宣告类型: replace-cross 摘要:视觉语言模型(VLM)展示了复杂的多模态推理能力,但在遇到知识冲突时容易产生幻觉,这阻碍了它们在信息敏感环境中的部署。虽然现有的研究关注于单模态模型的鲁棒性,但多模态领域缺乏对跨模态知识冲突系统的系统性调查。本研究引入了 \segsub,一种应用目标化图像扰动的框架,以调查 VLM 对知识冲突的韧性。我们的分析揭示了不同的脆弱性模式:虽然 VLM 对参数冲突表现出鲁棒性(20% 的一致性率),但在识别假设情境(<30% 的准确性)和解决来源冲突(<1% 的准确性)方面表现出显著的弱点。上下文丰富度与幻觉率之间的相关性(r = -0.368,p = 0.003)揭示了哪些类型的图像可能导致幻觉。通过在我们的基准数据集上进行目标化微调,我们展示了 VLM 知识冲突检测的改进,为在信息敏感环境中开发抗幻觉多模态系统奠定了基础。