arXiv 论文列表

TRIFFID：提升首 responders效率的自主机器人辅助系统

作者: Jorgen Cani, Panagiotis Koletsis, Konstantinos Foteinos, Ioannis Kefaloukos, Lampros Argyriou, Manolis Falelakis, Iv\'an Del Pino, Angel Santamaria-Navarro, Martin \v{C}ech, Ond\v{r}ej Severa, Alessandro Umbrico, Francesca Fracasso, AndreA Orlandini, Dimitrios Drakoulis, Evangelos Markakis, Georgios Th. Papadopoulos

arXiv:2502.09379v1 宣传类型: 横向摘要: 随着自然灾害事件复杂性的增加，迫切需要创新的技术解决方案来支持现场救援人员的努力。本文介绍了TRIFFID系统，这是一个全面的技术框架，将无人驾驶地面和空中车辆与先进的人工智能功能集成在一起，以增强对森林火灾、城市洪水和地震后的搜救任务的响应能力。通过利用最先进的自主导航、语义感知和人机交互技术，TRIFFID 提供了一个由以下关键组件组成的复杂系统：混合机器人平台、集中地面站、定制通信基础设施和智能手机应用程序。定义的研究和发展活动说明了深度神经网络、知识图谱和多模态信息融合如何使机器人能够自主导航和分析灾难环境，减少人员风险并加快响应时间。所提议的系统通过提供高级任务规划、安全监控和适应性任务执行能力来增强应急响应团队。此外，它确保在复杂和危险情况下实时态势感知和操作支持，促进快速和精确的信息收集以及协调行动。

发布时间: 2/14/2025

查看原文

语言代理在集体决策中的数字化代表

作者: Daniel Jarrett, Miruna P\^islar, Michiel A. Bakker, Michael Henry Tessler, Raphael K\"oster, Jan Balaguer, Romuald Elie, Christopher Summerfield, Andrea Tacchetti

arXiv:2502.09369v1 宣告类型: cross 摘要: 考虑集体决策过程，其中一组个体通过代理代理人参与的方式从一组替代选项中选择他们偏好的结果。在这个背景下，“代表性”是指通过代理代理人参与的方式使个体的偏好在过程中显现出来的一种活动——即他们的“代表”。为此，对人类行为的学到的模型有可能承担这一角色，这对于多智能体场景研究和机制设计具有实际意义。在本文中，我们研究训练“语言代理”以代表人类代理进行适当表达的可能性。首先，我们将集体决策的场景形式化——作为一组代理与决策机制间交互的阶段性过程。在此基础上，我们形式化了数字代表性的问题——即模拟代理的行为以产生与机制等效的结果。最后，我们在异质人类共识发现的场景中进行了一项实证案例研究，并证明了可以对大型语言模型进行微调以充当数字代表的可行性。

发布时间: 2/14/2025

查看原文

图变换器的简单路径结构编码

作者: Louis Airale, Antonio Longa, Mattia Rigon, Andrea Passerini, Roberto Passerone

arXiv:2502.09365v1 Announce Type: cross 摘要：图变换器将全局自注意力扩展到图结构数据中，实现了图学习领域的显著成功。最近，随机游走结构编码（RWSE）已被发现通过同时将结构信息和位置信息编码到边表示中进一步增强了其预测能力。然而，RWSE 无法总是区分属于不同局部图模式的边，这限制了其捕捉图形完整结构复杂性的能力。本文介绍了一种新颖的方法——简单路径结构编码（SPSE），利用简单路径计数进行边编码。我们通过理论和实验表明，SPSE 克服了RWSE 的局限性，提供了更为丰富的图结构表示，特别是在捕捉局部循环模式方面。为使 SPSE 计算上可行，我们提出了一种简单路径计数的高效近似算法。在各种基准测试中，包括分子和远距离图数据集上，SPSE 在识别任务中显示出比 RWSE 显著更高的性能提升。这些结果使 SPSE 成为增强图变换器表达能力的强大边编码替代方案。

发布时间: 2/14/2025

查看原文

神经空时点过程：趋势与挑战

作者: Sumantrak Mukherjee, Mouad Elhamdi, George Mohler, David A. Selby, Yao Xie, Sebastian Vollmer, Gerrit Grossmann

arXiv:2502.09341v1 通知类型: 交叉摘要：空间时间点过程（STPPs）是一类用于在连续空间和时间中建模事件的概率模型。现实世界的事件数据常常表现出复杂的相互依赖性和异质性动力学。通过结合现代深度学习技术，STPPs可以比传统方法更有效地建模这些复杂性。因此，神经方法与STPPs的融合已经成为一个活跃且快速发展的研究领域。在本文综述中，我们对现有的方法进行了分类，统一了关键设计选择，并解释了处理这种数据模式所面临的挑战。我们进一步突出了新兴趋势和多样的应用领域。最后，我们指出了文献中的开放挑战和空白。

发布时间: 2/14/2025

查看原文

药物-基因预测的图扩散网络

作者: Jiayang Wu, Wensheng Gan, Philip S. Yu

arXiv:2502.09335v1 交叉类型: 摘要：预测药物-基因关联对于药物开发和疾病治疗至关重要。虽然图神经网络（GNN）在这一任务中显示出有效性，但它们在数据稀疏性以及高效对抗学习实现方面面临挑战。我们提出了一个用于药物-基因预测的图扩散网络（GDNDGP），该框架通过两项关键创新来解决这些局限性。首先，它使用基于元路径的同质图学习来捕获药物-药物和基因-基因关系，确保相似实体共享嵌入空间。其次，它引入了一种并行扩散网络，在训练过程中生成硬负样本，从而避免了对耗尽的负样本检索的需求。我们的模型在DGIdb 4.0数据集上实现了优越的性能，并在三元药物-基因-疾病网络上展示了强大的泛化能力。结果显示，与现有方法相比，我们的方法在药物-基因预测任务中取得了显著改进，尤其是在处理复杂异构关系方面。源代码可以在https://github.com/csjywu1/GDNDGP公开获取。

发布时间: 2/14/2025

查看原文

当LM误解了人类的笑声：分析人类和语言模型中的歧义效应

作者: Samuel Joseph Amouyal, Aya Meltzer-Asscher, Jonathan Berant

arXiv:2502.09307v1 声明类型：cross 摘要：现代大型语言模型（LLMs）在许多语言任务中展示了类似人类的能力，引发了对LLMs和人类语言处理能力的比较兴趣。在这篇论文中，我们使用花园路径构造进行了一个详细的比较任务，这是对人类来说历来非常具有挑战性的句子理解任务。基于语言心理学研究，我们提出了关于为什么花园路径句子难以处理的假设，并通过理解问题在人类参与者和大量LLMs上测试了这些假设。我们的发现揭示了LLMs和人类在特定句法复杂性上都遇到了困难，有些模型与人类理解高度相关。为了补充这些发现，我们使用改写和文本到图像生成任务测试了LLMs对花园路径构造的理解，并发现结果与句子理解问题的结果相似，进一步验证了我们对这些构造的理解发现。

发布时间: 2/14/2025

查看原文

使用优化技术预测移动网络驱动测试结果

作者: MohammadJava Taheri, Abolfazl Diyanat, MortezaAli Ahmadi, Ali Nazari

arXiv:2502.09305v1 类别:交叉学科摘要：移动网络运营商不断优化其网络以确保卓越的服务质量和覆盖率。这种优化对于保持最佳用户体验至关重要，需要大量的数据收集和分析。收集这些数据的主要方法之一是通过路测，技术团队使用专门的设备在各个地区收集信号信息。然而，路测成本高昂且耗时，还面临着交通条件、环境因素以及某些区域的访问受限等挑战。这些约束使得难以在相同条件下重复进行路测。在本研究中，我们提出了一种方法，使运营商能够使用其他路测点的数据来预测特定位置的接收信号强度。通过减少广泛进行路测的需要，这种方法使运营商能够在节省时间和资源的同时，仍然获得优化网络和缓解传统路测相关挑战所需的必要数据。

发布时间: 2/14/2025

查看原文

SparQLe: 通过大语言模型将语音查询转换为文本翻译

作者: Amirbek Djanibekov, Hanan Aldarmaki

arXiv:2502.09284v1 类型: cross 摘要: 随着大型语言模型（LLMs）影响力的不断增长，将语音表示与它们结合以实现更流畅的多模态处理和语音理解的兴趣也在不断增加。这项研究介绍了一种新的方法，该方法利用自监督的语音表示与指令调优的大型语言模型相结合进行语音到文本的翻译。提出的方法利用一个模态适配器，使用英语数据将提取的语音特征与指令调优的大型语言模型对齐。我们的实验表明，这种方法有效地保留了输入语音的语义内容，并且作为一种自监督语音模型与指令调优的大型语言模型之间的有效桥梁，提供了各种语音理解应用的有前途的解决方案。

发布时间: 2/14/2025

查看原文

LiSA: 利用链路推荐通过子图注入攻击图神经网络

作者: Wenlun Zhang, Enyan Dai, Kentaro Yoshioka

arXiv:2502.09271v1 Announce Type: 针对性攻击摘要：图神经网络（GNNs）在建模具有图结构的数据方面展现了令人瞩目的能力，然而近期研究揭示了它们对对抗攻击的脆弱性。传统的攻击方法依赖于操纵原始图或在人工创建的节点上添加链接，往往在现实世界中证明是不切实际的。本文介绍了一种新的对抗场景，在GNN系统中通过注入孤立子图来欺骗链接推荐器和节点分类器。具体来说，链接推荐器被误导去提议受目标受害节点影响的节点与子图之间的链接，促使用户无意中建立连接，从而降低节点分类精度，从而促成成功的攻击。为此，我们提出了LiSA框架，该框架利用双重替代模型和 bilevel 优化同时满足两个对抗目标。在真实世界的数据集上进行的广泛实验展示了我们方法的有效性。

发布时间: 2/14/2025

查看原文

多臂多类列表分类

作者: Liad Erez, Tomer Koren

arXiv:2502.09257v1 宣告类型: cross 摘要: 我们研究了多类别列表分类问题，其中输入示例被映射到一个包含 $K$ 个可能标签集合中的 $m$ 个元素的子集，并且反馈是预测标签中存在于给定示例真实标签集中的那些标签。我们的主要结果是针对该问题的 $(\varepsilon,\delta)$-PAC 版本，我们设计了一个算法，该算法以高概率返回一个 $\varepsilon$-最优的假设，样本复杂度为 $O \big( (\mathrm{poly}(K/m) + sm / \varepsilon^2) \log (|H|/\delta) \big)$，其中 $H$ 是基础（有限）假设类，$s$ 是给定示例的真实标签数的上界。当 $s \ll K$ 时，此界优于已知的组合半带宽反馈问题的界。此外，在 $s = O(1)$ 的情况下，我们界的主要项与相应的全信息率匹配，这意味着半带宽反馈基本上不带来任何成本。我们的 PAC 学习算法在访问到 $H$ 的ERM预言机的情况下也是计算高效的。此外，我们还考虑了数据可以由对手生成的遗憾最小化设置，并建立了遗憾界 $\widetilde O(|H| + \sqrt{smT \log |H|})$。我们的结果推广并扩展了 Erez 等人（2024）的研究，他们考虑的是单标签设置，对应的 $s=m=1$，实际上这些结果适用于更一般的 $s$ 稀疏奖励的上下文组合半带宽反馈问题。

发布时间: 2/14/2025

查看原文