摘要
arXiv:2504.03640v1 宣告类型: 交叉
摘要: 为了开发通用协作代理,人类需要可靠的AI系统,这些系统能够(1)适应新的领域,(2)透明地处理不确定性,从而允许验证和纠正。黑箱模型展示了强大的数据处理能力,但由于其透明性差、领域特异性以及缺乏对不确定性的意识,它们不满足这些标准。我们介绍了一种组合和概率推理系统Bonsai,该系统通过检索相关基础证据并使用它来计算从更广泛的自然语言推理中派生出的子断言的可能性,生成可适应的推理树。Bonsai的推理能力可以通过证据缩放在测试时进行调整,它展示了在包括转录、照片、视频、音频和数据库在内的各种领域的可靠处理能力。问答和人类对齐实验表明,Bonsai在生成可解释的、与基础证据相关且具有不确定性的推理轨迹方面,与特定领域的黑箱方法的性能相当。