LLM2D

摘要

arXiv:2502.06173v1 类型: cross 摘要：对蛋白质-蛋白质相互作用（PPIs）的识别有助于推导细胞机制理解，特别是在神经退行性疾病、代谢综合征和癌症等复杂条件下。大型语言模型（LLMs）在自动化挖掘大量生物医学文献以预测蛋白质结构和相互作用方面表现出了显著的潜力；然而，它们固有的不确定性仍然是从生物学应用中获得可重复发现的关键挑战。在本研究中，我们提出了一种针对PPI分析的不确定性强化大型语言模型的方法，利用了微调的LaMa-3和BioMedGPT模型。为了增强预测可靠性，我们整合了LoRA集成和贝叶斯LoRA模型进行不确定性量化（UQ），确保对蛋白质行为提供信心校准的见解。我们的方法在不同疾病背景下实现了PPI识别的竞争力表现，同时解决了模型不确定性问题，从而增强了计算生物学中的可信度和可重复性。这些发现突显了不确定性强化大型语言模型适应性对推动精准医学和生物医学研究的潜在作用。