LLM2D

摘要

arXiv:2503.19650v1 类别: cross 摘要：本文报告了我们对幻觉及相关可观察过度生成错误的多语言共享任务 MU-SHROOM 的研究成果，该任务专注于在大型语言模型（LLMs）生成的输出中识别幻觉及相关过度生成错误。共享任务涉及在14种语言中检测构成幻觉的具体文本片段。为了解决这一任务，我们旨在提供关于英文中幻觉发生及其严重性的细腻、模型意识的理解。我们使用自然语言推理，并使用包含400个样本的合成数据集对ModernBERT模型进行微调，获得了0.032的Intersection over Union（IoU）分数和0.422的相关性分数。这些结果表明，模型的置信度分数与实际存在的幻觉之间存在适度正相关。IoU分数表明，我们的模型在预测的幻觉片段和真实标注之间有一定的重叠，但重叠较低。考虑到幻觉检测的复杂性，这种性能并不令人意外。幻觉通常通过微妙的方式表现出来，依赖于上下文，使得准确确定其确切边界变得困难。