LLM2D

摘要

arXiv:2504.05278v1 公告类型: 新摘要：本研究探讨了在医疗应用中大型语言模型（LLMs）中的不确定性量化，强调了技术和哲学层面的影响。随着LLMs在临床决策中的作用增加，准确传达不确定性对于确保可靠、安全和伦理的人工智能辅助医疗至关重要。我们的研究将不确定性视为知识的必要组成部分，而非障碍，邀请一种动态和反思性的方法来设计AI。通过结合贝叶斯推断、深度集成和蒙特卡洛丢弃等先进的概率方法，以及计算预测性和语义熵的语言分析，我们提出了一种综合框架，以管理先验和偶然不确定性。该框架包括代理建模以解决专有API的局限性，多源数据集成以提供更好的上下文，并通过持续学习和元学习进行动态校准。通过不确定性地图和信心度量嵌入可解释性，以支持用户信任和临床解释能力。我们的方法支持与负责任和反思性AI原则相一致的透明和伦理决策。从哲学上讲，我们提倡接受可控的模糊性，而不是追求绝对的可预测性，承认医学知识的内在临时性。