LLM2D

摘要

arXiv:2504.12314v1 宣传类型: cross 摘要: 大型语言模型在科学领域中越来越受欢迎，尤其是在分子理解和分析方面。然而，现有的模型受到了幻觉问题的影响，导致药物设计和使用的错误。在本文中，我们首先分析了分子理解任务中大型语言模型幻觉的来源，特别是在PubChem数据集中观察到的知识捷径现象。为了以计算效率的方式评估分子理解任务中的幻觉，我们引入了\textbf{Mol-Hallu}这一新颖的自由形式评估指标，该指标基于生成文本与实际分子性质之间的科学蕴含关系来量化幻觉的程度。利用Mol-Hallu指标，我们重新评估并分析了各种执行分子理解任务的大型语言模型中的幻觉程度。此外，我们还提出了幻觉减少后处理阶段(HRPP)来缓解分子幻觉。实验显示，HRPP在仅解码器和编码器-解码器分子大型语言模型中均有效。我们的发现为减轻幻觉和提高大型语言模型在科学应用中的可靠性提供了关键见解。