arXiv 论文列表

作者: Juri Opitz, Shira Wein, Nathan Schneider

大型语言模型 (LLM) 已经能够生成某些语言的流畅文本，而无需专门设计用于捕捉语法或语义连贯性的模块。这对自然语言处理中语言学专业知识的未来意味着什么？我们强调了自然语言处理 (NLP) (仍然) 依赖语言学，或者语言学思维可以阐明新方向的几个方面。我们围绕 RELIES 首字母缩写词来论证我们的观点，该首字母缩写词包含语言学对自然语言处理贡献的六个主要方面：资源、评估、低资源环境、可解释性、解释和语言研究。此列表并非详尽无遗，语言学也不是这些主题下每项工作的首要参考点；但在宏观层面上，这些方面突显了研究机器系统与人类语言系统之间关系的持久重要性。

发布时间: 11/25/2024

查看原文

FedCRL：基于对比共享表示的个性化联邦学习，用于解决非独立同分布数据中的标签异质性问题

作者: Chenghao Huang, Xiaolu Chen, Yanru Zhang, Hao Wang

由于标签分布倾斜和数据稀疏性导致的异构性，可能会导致主要依赖分布式计算的智能通信应用中出现不准确和不公平的问题。为了解决这个问题，本文提出了一种新颖的个性化联邦学习算法，名为联邦对比共享表示（FedCoSR），以促进客户端之间的知识共享，同时维护数据隐私。具体来说，局部模型浅层参数和典型的局部表示都被视为服务器可共享的信息，并在全局进行聚合。为了解决客户端之间标签分布倾斜导致的性能不佳问题，在局部表示和全局表示之间采用对比学习来丰富局部知识。此外，为了确保数据稀疏客户端的公平性，FedCoSR 引入了自适应局部聚合来协调全局模型在每个客户端的参与。我们的仿真结果表明，FedCoSR 通过在具有不同程度标签异构性的数据集上实现比现有方法更高的准确性和公平性，有效地缓解了标签异构性问题。

发布时间: 11/25/2024

查看原文

基于全景视图和三元组损失函数的分层定位

作者: Marcos Alfaro, Juan Jos\'e Cabrera, Mar\'ia Flores, \'Oscar Reinoso, Luis Pay\'a

本文主要目标是解决视觉定位问题，这对于移动机器人的安全导航至关重要。我们提出的解决方案采用全景图像和三元组卷积神经网络。我们试图利用这种架构的特性来解决室内环境中的分层和全局定位问题，这些环境容易出现视觉混叠和其他现象。考虑到这些架构中三元组损失函数的重要性，我们对不同的三元组损失函数进行了全面的比较评估。实验部分证明，可以使用相对较少的在特定光照条件下捕获的图像来训练三元组网络，即使如此，生成的网络仍然是执行动态条件下视觉定位的强大工具。我们的方法已经针对一些影响因素进行了评估，例如光照条件变化、遮挡、噪声和运动模糊。此外，为了探索我们方法的局限性，三元组网络已在不同的室内环境中同时进行了测试。在所有情况下，这些架构都展现了在各种具有挑战性的场景中进行泛化的强大能力。实验中使用的代码可在https://github.com/MarcosAlfaro/TripletNetworksIndoorLocalization.git获取。

发布时间: 11/25/2024

查看原文

用于鲁棒反事实解释的区间抽象

作者: Junqi Jiang, Francesco Leofante, Antonio Rago, Francesca Toni

反事实解释 (CE) 已成为可解释人工智能研究中的一个主要范式，为受机器学习模型决策影响的用户提供补救建议。然而，现有方法找到的反事实解释在模型参数发生细微变化时往往失效。文献中缺乏一种方法能够为模型变化下的反事实解释提供详尽的稳健性保证，因为现有改进反事实解释稳健性的方法大多是启发式的，并且稳健性性能仅使用有限数量的重新训练模型进行经验评估。为了弥补这一差距，我们提出了一种针对参数化机器学习模型的新型区间抽象技术，该技术使我们能够获得在可能无限的合理模型变化集 Δ 下反事实解释的可证明稳健性保证。基于此思想，我们在二元和多类分类设置中正式定义了反事实解释的稳健性概念，我们称之为 Δ-稳健性。我们提出了基于混合整数线性规划验证 Δ-稳健性的程序，并利用该程序进一步提出了生成 Δ-稳健的反事实解释的算法。在一个涉及神经网络和逻辑回归模型的广泛实证研究中，我们证明了该方法的实际适用性。我们讨论了确定方法中适当超参数的两种策略，并定量地对十一种方法生成的 CE 进行了基准测试，突出了我们的算法在寻找稳健的 CE 方面的有效性。

发布时间: 11/25/2024

查看原文

超越联合演示：面向高效多智能体强化学习的个性化专家指导

作者: Peihong Yu, Manav Mishra, Alec Koppel, Carl Busart, Priya Narayan, Dinesh Manocha, Amrit Bedi, Pratap Tokekar

多智能体强化学习 (MARL) 算法面临着由于联合状态-动作空间大小呈指数增长而导致的有效探索挑战。虽然示范引导学习在单智能体环境中已被证明是有益的，但其直接应用于 MARL 会受到获取联合专家示范的实际困难的阻碍。在这项工作中，我们引入了一种新颖的个性化专家示范概念，该概念针对每个单独的智能体，或者更广泛地说，针对异构团队中每种类型的智能体进行定制。这些示范仅与单智能体行为以及每个智能体如何实现个人目标有关，而不包含任何合作元素，因此简单地模仿它们不会实现合作，因为可能存在冲突。为此，我们提出了一种选择性地利用个性化专家示范作为指导并允许智能体学习合作的方法，即个性化专家引导 MARL (PegMARL)。该算法利用两个判别器：第一个根据单个智能体行为与示范的一致性提供激励，第二个根据行为是否导致预期结果来调节激励。我们在离散和连续环境中使用个性化示范评估 PegMARL。结果表明，即使提供次优示范，PegMARL 也可以学习接近最优的策略，并且在解决协调任务方面优于最先进的 MARL 算法。我们还展示了 PegMARL 利用星际争霸场景中联合示范的能力，即使使用来自非协同训练策略的示范也能有效收敛。

发布时间: 11/25/2024

查看原文

稳定神经随机微分方程在分析不规则时间序列数据中的应用

作者: YongKyung Oh, Dongyoung Lim, Sungil Kim

现实世界中的时间序列数据常常存在不规则采样间隔和缺失值，这给那些假设采样间隔一致且数据完整度的传统方法带来了挑战。神经常微分方程 (Neural ODEs) 提供了一种替代方法，它结合神经网络和常微分方程求解器，通过参数化向量场学习连续的潜在表示。神经随机微分方程 (Neural SDEs) 在 Neural ODEs 的基础上引入了扩散项，但这并非易事，尤其是在处理不规则间隔和缺失值时。因此，仔细设计漂移和扩散函数对于维持稳定性和提高性能至关重要，而草率的选择可能会导致诸如缺乏强解、随机失稳或欧拉离散化不稳定等不利特性，从而显著影响 Neural SDEs 的性能。在本研究中，我们提出了三类稳定的 Neural SDEs：Langevin 型 SDE、线性噪声 SDE 和几何 SDE。然后，我们严格证明了它们在保持出色性能方面的鲁棒性，同时有效地防止过拟合。为了评估我们方法的有效性，我们在四个基准数据集上进行了广泛的实验，涵盖插值、预测和分类任务，并使用 30 个公共数据集分析了我们方法在不同缺失率下的鲁棒性。我们的结果证明了所提出的方法在处理现实世界不规则时间序列数据方面的有效性。

发布时间: 11/25/2024

查看原文

AdaFlow：基于方差自适应流的模仿学习

作者: Xixi Hu, Bo Liu, Xingchao Liu, Qiang Liu

基于扩散的模仿学习改进了多模态决策中的行为克隆（BC），但由于扩散过程中的递归，推理速度显著降低。这促使我们设计高效的策略生成器，同时保持生成多样化动作的能力。为了应对这一挑战，我们提出了AdaFlow，一个基于流生成模型的模仿学习框架。AdaFlow用状态条件常微分方程（ODE）表示策略，这些方程被称为概率流。我们揭示了它们的训练损失的条件方差与ODE的离散化误差之间一个有趣的联系。基于此认识，我们提出了一种方差自适应ODE求解器，它可以在推理阶段调整步长，使AdaFlow成为一个自适应决策者，在不牺牲多样性的情况下提供快速推理。有趣的是，当动作分布为单模态时，它会自动简化为一步生成器。我们全面的实证评估表明，AdaFlow以快速推理速度实现了高性能。

发布时间: 11/25/2024

查看原文

与大型语言模型的博弈：提示技巧、能力差距与推理缺陷

作者: Johannes Schneider, Steffi Haag, Leona Chandra Kruse

大型语言模型（LLM），例如ChatGPT，在创纪录的时间内突破了1亿用户大关，并可能日益渗透到我们生活的方方面面，从而导致人工智能模型与人类之间出现多种多样的互动方式。虽然许多研究从第一性原理出发，演绎性地讨论了治理和监管问题，但很少有研究基于观察人与LLM之间对话的归纳性、数据驱动的方法，尤其是在可能对人类构成严重威胁的非合作性、竞争性情境中。在这项工作中，我们进行了一项用户研究，让40多位不同年龄段的参与者与LLM进行价格谈判。我们探讨了人们如何与LLM互动，研究了谈判结果和策略的差异。此外，我们还指出了LLM在推理能力方面的不足，以及由此导致的容易受到提示攻击的影响，这种攻击意图操纵LLM达成违反其指令或超越任何理性的协议。我们还表明，人类设法达成的谈判价格范围很广，这表明在有效地与LLM互动方面存在差距。

发布时间: 11/25/2024

查看原文

NeuroGraph：脑连接组学中图机器学习的基准测试

作者: Anwar Said, Roza G. Bayrak, Tyler Derr, Mudassir Shabbir, Daniel Moyer, Catie Chang, Xenofon Koutsoukos

机器学习为分析高维功能性神经影像数据提供了一种宝贵的工具，并被证明可有效预测各种神经系统疾病、精神障碍和认知模式。在功能性磁共振成像 (MRI) 研究中，大脑区域之间的相互作用通常使用基于图的表示进行建模。基于图的机器学习方法的效力已在无数领域得到证实，标志着数据解释和预测建模的变革性步骤。然而，尽管这些技术很有前景，但由于潜在的预处理流程数量庞大以及基于图的数据集构建的大型参数搜索空间，将其应用于神经影像领域一直面临挑战。在本文中，我们介绍了 NeuroGraph，这是一个基于图的神经影像数据集集合，并证明了其预测多种行为和认知特征的效用。我们通过创建包含静态和动态大脑连接的 35 个数据集，运行超过 15 种基线方法进行基准测试，深入研究了数据集生成搜索空间。此外，我们还提供了在静态图和动态图上学习的通用框架。我们广泛的实验得出了一些关键的观察结果。值得注意的是，使用相关向量作为节点特征、结合更多感兴趣区域以及使用更稀疏的图可以提高性能。为了促进基于图的数据驱动神经影像分析的进一步发展，我们提供了一个全面的开源 Python 包，其中包括基准数据集、基线实现、模型训练和标准评估。

发布时间: 11/25/2024

查看原文

语义提示语言模型改进视觉描述

作者: Michael Ogezi, Bradley Hauer, Grzegorz Kondrak

像CLIP这样的语言-视觉模型在视觉任务（例如零样本图像分类（ZSIC））方面取得了显著进展。然而，生成具体且表达力强的视觉描述仍然具有挑战性；当前方法生成的描述往往模棱两可且缺乏粒度。为了解决这些问题，我们提出了V-GLOSS：视觉注释，这是一种基于两个关键思想的新方法。第一个是语义提示，它使语言模型以结构化的语义知识为条件。第二个是一种新的对比算法，它可以引出相似概念之间的细微差别。通过这两个想法，我们证明了V-GLOSS改进了视觉描述，并在ImageNet、STL-10、FGVC飞机和Flowers 102等通用和细粒度图像分类数据集上的零样本设置中取得了显著成果。此外，这些描述能力有助于增强图像生成性能。最后，我们引入了一个经过质量检验的银标准数据集，其中包含使用V-GLOSS为所有ImageNet类别生成的描述。

发布时间: 11/25/2024

查看原文