arXiv:2505.07005v1 宣告类型: 新
摘要: 近年来,人工智能技术在各领域和各个应用中表现出色。然而,神经网络中的各种算法使得难以理解决策背后的理由。因此,可信赖的人工智能技术开始受到青睐。可信赖性的概念是跨学科的;它必须符合社会标准和原则,并且技术被用来满足这些要求。在这篇论文中,我们首先概述了来自不同国家和地区使人工智能算法可信赖的伦理元素的发展;然后我们将调查重点放在人工智能可解释性的先进研究上。我们对使人工智能可解释的技术和方法进行了详尽的调查。最后,我们确定了可解释人工智能领域的新兴趋势。特别是,我们详细阐述了人工智能的可解释性与自主系统的元推理之间的强大联系。元推理的概念是“反思推理”,这与可解释人工智能的意图和目标相吻合。方法的结合将为可解释的人工智能系统铺平道路。
arXiv:2505.06997v1 通知类型: 新
摘要: 移动群众感知超越了传统的以人类为中心的模型,将无人机(UAV)和无人地面车辆(UGV)等异构实体整合在一起。在复杂环境、有限通信和部分可观测性的挑战性紧急救援场景中,这些多样化的代理之间的任务分配优化至关重要。本文专门针对紧急救援场景,考虑了人类、无人机和无人地面车辆的情况下,解决了异构实体协作感知任务分配(HECTA)问题。我们引入了一种新的“硬合作”策略,其中无人地面车辆优先为低电量无人机充电,同时执行其感知任务。主要目标是在严格的时间限制下最大化任务完成率(TCR)。我们严格地将这个NP难问题形式化为去中心化的部分可观测马尔可夫决策过程(Dec-POMDP),以有效地处理不确定性下的顺序决策。为了解决这个问题,我们提出了一种名为HECTA4ER的新多智能体强化学习算法,基于集中训练与分散执行的架构。HECTA4ER包括定制设计的功能,包括复杂的特征提取模块,利用隐藏状态的历史动作观察,以及一个整合全局和本地信息的混合网络,特别应对部分可观测性的挑战。此外,理论分析确认了该算法的收敛性质。广泛的仿真表明,HECTA4ER显著优于基线算法,平均提升了18.42%的TCR。更重要的是,现实世界的案例研究验证了该算法在动态感知场景下的有效性和稳健性,强调了其在紧急响应中的实际应用潜力。
arXiv:2505.06977v1 宣告类型: 新增
摘要: 多任务模型合并提供了一种有前途的范式,可以在不进行额外训练的情况下将多个专家模型整合到一个统一模型中。现有的最先进的技术,如任务算术及其变体,通过累积任务向量(即,预训练模型和微调模型之间的参数差异)将模型合并在一起。然而,任务向量的累积常常受到知识冲突的阻碍,导致性能下降。为了应对这一挑战,我们提出了一种名为冲突感知任务合并(CAT 合并)的新型无训练框架,该框架选择性地从任务向量中裁剪出易引起冲突的组件。CAT 合并引入了几种针对参数的具体策略,包括线性权重的投影以及归一化层中缩放和平移参数的掩码。在视觉、语言和视觉语言任务上的广泛实验表明,CAT 合并有效地抑制了知识冲突,相比最先进的方法在 ViT-B/32 上平均提高了 2.5% 的准确率,并在 ViT-L/14 上提高了 2.0%。
arXiv:2505.06964v1 宣布类型: 新
摘要: 尽管大型语言模型(LLMs)在多种通用知识和推理任务中取得了显著的性能,但在化学和生物工程(CBE)这一科学领域中的实用性仍不清楚。因此,需要具有挑战性的评估基准来衡量LLMs在基于知识和推理的任务中的性能,而这样的基准目前是缺乏的。作为基础步骤,我们实证测量了LLMs在CBE中的推理能力。我们构建并分享了一个专家精心策划的数据集,包含5,920个示例,用于评估LLMs在离子液体(ILs)领域进行碳捕获的推理能力,这是一个减少全球变暖的新兴解决方案。该数据集在语言和领域特定知识的维度上呈现出不同的难度级别。在数据集上对三个参数少于10B的开源LLMs进行基准测试表明,尽管较小的通用LLMs对于ILs有一定的了解,但它们缺乏领域特定的推理能力。根据我们的研究结果,我们进一步讨论了利用LLMs进行ILs用于碳捕获研究的考虑因素。由于LLMs具有高碳足迹,为ILs研究优化它们可以在两个领域中互惠互利,并有助于实现到2050年实现雄心勃勃的碳中和目标。数据集链接: https://github.com/sougata-ub/llms_for_ionic_liquids
arXiv:2505.06949v1 宣布类型: 新
摘要: 已知图和结构因果模型在组织生物医学知识和估计因果效应方面各具优势,但两者仍保持很大程度上的分离:已知图编码定性的关系,关注事实和演绎推理,而缺乏正式的概率语义;因果模型则缺乏与已知图中的背景知识的集成,并且不具有已知图提供的演绎推理能力。为弥合这一差距,我们提出了因果知识图谱(CKGs)的新颖形式,该形式扩展了已知图中的正式因果语义,同时保持其演绎推理能力并使有效的因果推理成为可能。CKGs 支持通过明确标记因果边进行反混淆,并促进与编码和推导出的背景知识一致的假设制定。我们构建了一个药物-疾病因果知识图谱(DD-CKG),整合了疾病进展途径、药物适应症、副作用以及疾病层次分类,以实现自动化大规模中介分析。应用于UK BIOBANK和MIMIC-IV队列,我们测试了药物是否在适应症和下游疾病进展之间充当媒介效应,并根据DD-CKG推断出的潜在混杂因素进行了调整。我们的方法成功地以高精度再现了已知的不良反应,同时识别了以前未记录的重要候选不良反应。进一步通过副作用相似性分析验证表明,将我们预测的药物效应与现有的数据库结合使用显著提高了对共享药物适应症的预测能力,支持了我们新颖发现的临床相关性。这些结果证明了我们的方法提供了一种可扩展的知识驱动的因果推理框架。
arXiv:2505.06907v1 宣布类型: 新颖
摘要: 大型语言模型(LLMs)如ChatGPT、DeepSeek和Grok-3的兴起重塑了人工智能的格局。作为建立在LLMs基础上的基础模型(FMs)的典型案例,这些模型展示了生成类人类内容的显著能力,使我们更接近实现通用人工智能(AGI)。然而,它们的大规模特性、对隐私问题的敏感性以及巨大的计算需求给终端用户提供了个性化定制带来了一些重大挑战。为了解决这些问题,本文提出了人工个性化智能(API)的愿景,专注于将这些强大的模型适应特定用户的需要和偏好,同时保持隐私和效率。具体来说,本文提出了一种个性化联邦智能(PFI)的方法,将联邦学习(FL)的隐私保护优势与FMs的零样本泛化能力相结合,使得在边缘实现个性化、高效且隐私保护的部署成为可能。我们首先回顾了联邦学习和FMs的最新进展,并讨论了利用FMs增强联邦系统潜力的可能性。然后,我们探讨了实现PFI的核心动机,并探索了该领域的有希望的机会,包括高效的PFI、可信赖的PFI以及基于检索增强生成(RAG)的PFI。最后,我们概述了部署FM驱动的边缘FL系统的关键挑战和未来研究方向,这些系统提供了增强的个性化、计算效率和隐私保障。总体而言,本文旨在为API的发展奠定基础,作为AGI的补充,特别关注PFI作为关键技术的作用。
arXiv:2505.06897v1 通知类型: 新
摘要: 人工智能(AI)的最终目标是实现人工通用智能(AGI)。拥有物理存在并与环境进行实时互动的嵌入式人工智能(EAI)已成为追求AGI的关键研究方向。尽管深度学习、强化学习、大规模语言模型和多模态技术的进步显著促进了EAI的发展,但大多数现有的综述文章主要集中在特定的技术或应用上。系统性的回顾,特别是探讨EAI与AGI之间直接联系的综述仍然稀缺。本文将EAI视为AGI的基础方法,系统分析其四个核心模块:感知、智能决策、行动和反馈。我们详细讨论了每个模块如何为AGI的六大核心原则作出贡献。此外,我们还讨论了EAI未来的发展趋势、挑战和研究方向,强调其作为AGI开发基石的潜力。我们的研究结果表明,EAI的动态学习和现实世界互动的结合是缩小狭义AI与AGI之间差距的关键。
arXiv:2505.06856v1 Announce Type: 新
摘要:准确的轨迹预测长期以来一直是自动驾驶(AD)的主要挑战之一。传统的数据驱动模型主要依赖于统计相关性,往往忽略了管理交通行为的因果关系。在这篇论文中,我们介绍了一种新颖的轨迹预测框架,通过利用因果推理来增强预测的稳健性、泛化能力和准确性。通过将环境分解为空间和时间的组成部分,我们的方法识别并缓解了虚假的相关性,揭示了真正的因果关系。我们还采用了一种渐进融合策略来集成多模态信息,模拟了类似于人类的推理过程,并使实时推理成为可能。在五个实际数据集——ApolloScape、nuScenes、NGSIM、HighD和MoCAD——上的评估表明,我们的模型在关键指标如RMSE和FDE上优于现有最先进的(SOTA)方法。我们的结果强调了因果推理在轨迹预测中的潜力,为构建稳健的自动驾驶系统铺平了道路。
arXiv:2505.06817v1 宣告类型: 新
摘要: 剧情化人工智能系统代表了人工智能领域的一个新前沿,其中基于大型语言模型(LLMs)的代理通常会与其他工具、环境和其他代理交互以实现一定程度的自主任务完成。这些系统在各个领域都有潜力,但它们的架构基础仍然不成熟。本文对代理类型、它们与环境的交互模式以及随之而来的基础设施和架构挑战进行了全面审查。我们指出,在这些系统中大规模管理工具编排的差距,并提出了一个可重用的设计抽象:“控制平面作为工具”模式。此模式允许开发者向代理暴露单一的工具接口,并将其模块化工具路由逻辑封装在其后面。我们将此模式置于更广泛的代理设计背景下,并认为它解决了可扩展性、安全性和可扩展性等几个关键挑战。
arXiv:2505.06769v1 宣告类型: 新
摘要: 两类概率系统的标准模型是马尔可夫链(MCs)和马尔可夫决策过程(MDPs)。此类概率模型的经典目标是可达性和随机最短路径。这些问题的广泛研究算法方法是值迭代(VI)算法,该算法通过应用局部更新(称为贝尔曼更新)进行迭代更新。文献中有许多关于VI的实用方法,但它们在最坏情况下需要指数级的贝尔曼更新。预处理步骤是一个离散的、图论的算法,需要线性空间。一个重要但未解决的问题是在多项式时间预处理后,VI是否可以通过次指数级的贝尔曼更新来实现。在这项工作中,我们提出了一种基于猜测值的VI新方法。我们的理论贡献有两个方面。首先,对于MCs,我们提出了一种几乎线性时间的预处理算法,之后与猜测值一起,VI只需要次指数级的贝尔曼更新。其次,我们改进了VI在MDPs中收敛速度的分析。最后,我们基于新方法提出了一种实用的MDPs算法。实验结果表明,我们的方法在文献中的多个基准例子上比现有的基于VI的方法有显著的改进。