摘要
arXiv:2504.05278v1 公告类型: 新
摘要:本研究探讨了在医疗应用中大型语言模型(LLMs)中的不确定性量化,强调了技术和哲学层面的影响。随着LLMs在临床决策中的作用增加,准确传达不确定性对于确保可靠、安全和伦理的人工智能辅助医疗至关重要。我们的研究将不确定性视为知识的必要组成部分,而非障碍,邀请一种动态和反思性的方法来设计AI。通过结合贝叶斯推断、深度集成和蒙特卡洛丢弃等先进的概率方法,以及计算预测性和语义熵的语言分析,我们提出了一种综合框架,以管理先验和偶然不确定性。该框架包括代理建模以解决专有API的局限性,多源数据集成以提供更好的上下文,并通过持续学习和元学习进行动态校准。通过不确定性地图和信心度量嵌入可解释性,以支持用户信任和临床解释能力。我们的方法支持与负责任和反思性AI原则相一致的透明和伦理决策。从哲学上讲,我们提倡接受可控的模糊性,而不是追求绝对的可预测性,承认医学知识的内在临时性。