arXiv 论文列表

KALE-LM：通过知识和逻辑增强的大模型释放AI科学潜力

作者: Weichen Dai, Yezeng Chen, Zijie Dai, Yubo Liu, Zhijie Huang, Yixuan Pan, Baiyang Song, Chengli Zhong, Xinhe Li, Zeyu Wang, Zhuoying Feng, Yi Zhou

arXiv:2409.18695v2 宣布类型: 更换摘要：人工智能逐步展示出其巨大的潜力，并且越来越多的关注被放在如何利用AI推进科学研究上。在这篇愿景论文中，我们提出了AI如何更好地辅助科学探索的视角，并探讨了相应的技术方法。我们提出并开源了KALE-LM模型系列中的两个大型模型，KALE-LM-Chem(-1.5)，这些模型在化学领域的相关任务中取得了卓越的性能。我们希望我们的工作能作为强有力的起点，帮助实现更智能的AI，促进人类科学和技术的进步，以及社会的发展。

发布时间: 4/8/2025

查看原文

基于解释型AI提高DL为基础的信道估计效率

作者: Abdul Karim Gizzini, Yahia Medjahdi, Ali J. Ghandour, Laurent Clavier

arXiv:2407.07009v2 宣布类型: 重置摘要: 基于人工智能（AI）的决策支持是未来6G网络的关键要素，在其中将引入原生AI的概念。此外，AI 在自动驾驶和医疗诊断等不同关键应用中也被广泛使用。在这些应用中，使用黑箱模型进行AI决策是具有风险和挑战性的。因此，理解并信任这些模型所做的决策非常重要。解决这一问题可以通过开发可解释AI（XAI）方案来实现，这些方案旨在解释黑箱模型行为背后的逻辑，从而确保其高效和安全的部署。最近，我们提出了一种名为XAI-CHEST的新颖扰动基XAI框架，该框架旨在无线通信中的信道估计。XAI-CHEST框架的核心思想是通过在无关输入上引入高噪声来识别相关模型输入。本文提供了XAI-CHEST框架的详细理论基础。特别是，我们推导了XAI-CHEST损失函数的解析表达式和噪声阈值微调优化问题。因此，设计的XAI-CHEST提供了一种智能输入特征选择方法，可以进一步提高整体性能并优化所用模型的架构。仿真结果表明，XAI-CHEST框架提供了有效的解释，它在降低所需计算复杂度的同时，相较于经典的基于深度学习的信道估计，提高了比特错误率性能。

发布时间: 4/8/2025

查看原文

本体嵌入：方法、应用和资源综述

作者: Jiaoyan Chen, Olga Mashkova, Fernando Zhapa-Camacho, Robert Hoehndorf, Yuan He, Ian Horrocks

arXiv:2406.10964v3 公告类型：替换摘要：本体广泛用于表示领域知识和元数据，在信息系统、语义web、生物信息学等众多领域中发挥着越来越重要的作用。然而，本体可以直接支持的逻辑推理在学习、逼近和预测方面非常有限。一种直接的解决方案是结合统计分析和机器学习。为此，自动生成本体知识的向量表示即本体嵌入被广泛研究。许多关于本体嵌入的论文已经发表，但由于缺乏系统的综述，研究人员难以获得这一领域的全面理解。为了弥合这一差距，我们撰写了这篇综述论文，首先介绍了不同类型的本体语义，并形式化定义了本体嵌入及其忠实性。在此基础上，它系统地对超过80篇论文进行了分类和分析，这些论文根据不同类型的本体及其技术解决方案，包括几何建模、序列建模和图传播进行了划分。这篇综述还介绍了本体嵌入在本体工程、机器学习增强和生命科学中的应用，介绍了新的库mOWL，并讨论了挑战和未来方向。

发布时间: 4/8/2025

查看原文

多个头比一个更好：模态知识专家混合体用于实体表示学习

作者: Yichi Zhang, Zhuo Chen, Lingbing Guo, Yajing Xu, Binbin Hu, Ziqi Liu, Wen Zhang, Huajun Chen

arXiv:2405.16869v4 宣告类型: 替换摘要: 学习高质量的多模态实体表示是多模态知识图谱（MMKG）表示学习的重要目标，这可以增强多模态知识图谱中的推理任务，例如多模态知识图谱补全（MMKGC）。主要挑战是协作建模大量三元组中隐藏的结构信息和实体的多模态特征。现有的方法集中在设计优雅的基于实体的多模态融合策略，但它们忽略了在不同关系背景下隐藏在模态中的多视角特征的利用。为了解决这一问题，我们引入了一个名为Mixture of Modality Knowledge experts（MoMoK）的新框架，以更好地学习多模态实体表示，用于MMKGC。我们设计了关系导向的模态知识专家来获取关系感知的模态嵌入，并结合多模态的预测结果以实现联合决策。此外，我们通过最小化专家之间的互信息来分离专家。在四个公开的MMKG基准数据集上的实验结果显示，在复杂场景下MoMoK表现出色。

发布时间: 4/8/2025

查看原文

AndroidWorld：自主代理的动态基准测试环境

作者: Christopher Rawles, Sarah Clinckemaillie, Yifan Chang, Jonathan Waltz, Gabrielle Lau, Marybeth Fair, Alice Li, William Bishop, Wei Li, Folawiyo Campbell-Ajala, Daniel Toyama, Robert Berry, Divya Tyamagundlu, Timothy Lillicrap, Oriana Riva

arXiv:2405.14573v5 自动化类型: 替换摘要：通过控制计算机来执行人类任务的自主代理可以提高人类的生产力和应用的易用性。然而，该领域的进步将由现实和可重复的基准驱动。我们提出了AndroidWorld，这是一个功能齐全的Android环境，提供了来自20款真实Android应用的116个程序任务的奖励信号。与现有的交互式环境不同，AndroidWorld动态构建任务，这些任务根据自然语言参数化并以无限多种方式表达，从而使得可以在更大且更具现实主义的一系列任务上进行测试。为了确保可重复性，每个任务都包括专门的初始化、成功检查和拆卸逻辑，这些逻辑会修改和检查设备的系统状态。我们使用基准代理来测试AndroidWorld，并提供了基准上的初始结果。我们的最佳代理能够完成AndroidWorld任务的30.6%，表明未来工作有很大的空间。此外，我们将一个流行的桌面Web代理适应用于移动平台，尽管我们发现它在移动平台上效果不佳，这表明未来的研究需要实现跨平台的通用代理。最后，我们还进行了稳健性分析，表明任务变化可以显著影响代理性能，表明如果没有这种测试，代理性能指标可能不能全面反映实际挑战。AndroidWorld以及本文中的实验可以在github.com/google-research/android_world获取。

发布时间: 4/8/2025

查看原文

在线POMDP规划，带有随时可用的确定最优性保证

作者: Moran Barenboim, Vadim Indelman

arXiv:2310.01791v4 宣告类型：替换摘要：在信息不完整的情况下，不确定环境下的决策是许多实际自主系统的关键方面。部分可观测马尔可夫决策过程（POMDP）提供了在这些条件下形式化决策问题的数学稳健框架。然而，找到POMDP的最优解通常是不可行的。近年来，使用在线树搜索求解器从小型问题扩展到中等规模问题的近似求解器的规模扩展取得了一定的进展。通常，这样的近似求解器仅提供最优解的概率性或渐近性保证。在本文中，我们为离散POMDP导出了近似解与最优解之间的确定性关系。我们证明，在任何时间点，都可以导出将现有解与最优解联系起来的界。我们展示了我们的推导为一组新的算法提供了途径，并可以附加到具有特定结构的现有算法上，以提供确定性的保证，且计算开销很小。通过这种方法，我们不仅证明了解决方案的质量，而且还展示了基于确定性保证进行决策可能会比未进行确定性认证的原算法在性能上更优。

发布时间: 4/8/2025

查看原文

URECA: 唯一区域描述任意内容

作者: Sangbeom Lim, Junwan Kim, Heeji Yoon, Jaewoo Jung, Seungryong Kim

arXiv:2504.05305v1 类型: cross 摘要：区域级描述旨在为特定图像区域生成自然语言描述，同时突出其独特的特征。然而，现有的方法在多粒度下难以生成独特的描述，限制了它们的实际应用。为了解决对多粒度区域理解的需要，我们介绍了URECA数据集，这是一个针对多粒度区域描述专门设计的大规模数据集。与以往主要关注显著对象的 datasets 不同，URECA数据集通过结合多样的对象、部分和背景元素，确保区域和描述之间具有独特的且一致的映射关系。这一方法的核心是逐步的数据整理流水线，每个阶段逐步细化区域选择和描述生成。通过在每个阶段利用多模态大型语言模型（MLLMs），我们的流水线能够生成独特且基于上下文的描述，同时提高准确性和语义多样性。基于这个数据集，我们提出了URECA，这是一种新型的描述模型，旨在有效编码多粒度区域。URECA通过简单但有效的现有MLLMs的修改，保留了关键的时空属性，如位置和形状，从而实现细粒度且语义丰富的区域描述。我们的方法引入了动态掩码建模和高分辨率掩码编解码器，以增强描述的独特性。实验结果显示，URECA在URECA数据集上达到了最先进的性能，并且很好地推广到了现有的区域级描述基准上。

发布时间: 4/8/2025

查看原文

迪翁：一种适用于大型模型的通信高效优化器

作者: Kwangjun Ahn, Byron Xu

arXiv:2504.05295v1 Announce Type: 横向摘要: 高效训练大型AI模型需要在多个加速器上分配计算，但在梯度同步期间往往会引入显著的通信开销。我们引入了Dion，这是一种通信高效的优化器，它保留了标准分布式训练（例如，DDP、FSDP）的同步语义，同时大幅减少了I/O成本。与常规优化器同步完整梯度矩阵不同，Dion利用本地设备上的正交更新和动量缓冲区，消除了全梯度交换的需要。此外，它还支持一种高效的切分策略，在训练过程中避免重构大型矩阵。

发布时间: 4/8/2025

查看原文

随时间学习推理：时间线自我反思以提高语言模型的时序推理能力

作者: Adri\'an Bazaga, Rexhina Blloshmi, Bill Byrne, Adri\`a de Gispert

arXiv:2504.05258v1 类型: cross 摘要：大型语言模型（LLMs）已成为生成连贯文本、理解上下文和执行推理任务的强大工具。然而，它们在处理时间推理方面存在困难，这需要处理与事件序列、持续时间以及跨时间关系相关的时间信息。这些能力对于问答、调度和历史分析等应用至关重要。在本文中，我们介绍了TISER，这是一种新颖的框架，通过结合时间轴构建和迭代自我反思的多阶段过程来增强LLMs的时间推理能力。我们的方法利用测试时扩增来延长推理轨迹的长度，从而使模型能够更有效地捕捉复杂的时间依赖性。这种策略不仅提高了推理准确性，还改善了推理过程的可追溯性。实验结果表明，TISER在多个基准测试中表现出最先进的性能，包括在离分布测试集上的表现，并揭示了TISER使较小的开源模型在具有挑战性的时间推理任务中超越了较大的封闭权重模型。

发布时间: 4/8/2025

查看原文

对抗性KA

作者: Sviatoslav Dzhenzher, Michael H. Freedman

arXiv:2504.05255v1 Announce Type: 交叉摘要：将柯尔莫戈罗夫和阿诺尔德（KA）表示定理视为表示或“表达”函数的算法，我们通过分析其抵御对抗攻击的能力来测试其稳健性。我们发现KA对可数集合的连续对手是稳健的，但发现了关于外函数的等度连续性的问题，这至今阻碍了我们对极限进行操作并打败连续对手群体。关于外函数的正则性这一问题，与KA在一般神经网络理论中的应用争议有关。

发布时间: 4/8/2025

查看原文