LLM2D

arXiv 论文列表

作者: Meghyn Bienvenu, Camille Bourgaux, Atefe Khodadaditaghanaki
arXiv:2505.10394v1 交叉公告类型: 摘要: 在本文中,我们探讨了 DatalogMTL 中的一致性处理问题,DatalogMTL 是一种带有度量时态操作符的 Datalog 扩展。由于事实与时间区间相关联,当它们与规则相矛盾时,存在不同的方法来恢复一致性,例如删除事实或将它们的时间区间修改。我们的第一个贡献是对这种情况下的一致性冲突(不一致的最小解释)和修复(恢复一致性的可能方式)的相关概念进行了定义,并研究了这些概念及其相关的一致性容忍语义的性质。我们的第二个贡献是对基于修复的语义下生成单个冲突/修复和查询蕴含的数据复杂性进行了分析。
发布时间: 5/16/2025
查看原文
作者: Agustin Medina, Marcelo Arlego, Carlos A. Lamas
arXiv:2505.10393v1 宣告类型: cross 摘要: 我们研究了使用训练在合成数据上的人工神经网络高效学习磁性相位的方法,结合了计算简便性和基于物理的策略。我们集中在缺乏精确解析解的稀释伊辛模型上,探索了两种互补的方法:一种是使用简单的密集神经网络进行监督分类,另一种是使用仅在理想化的自旋配置上训练的卷积自编码器进行无监督的相变检测。 为了提高模型性能,我们引入了两种关键的物理指导形式。首先,我们利用体系结构偏向来优先放大与对称破缺相关的特征。其次,我们包括明确打破 $\mathbb{Z}_2$ 对称性的训练配置,强化网络探测有序相的能力。这些机制协同作用,即使没有明确的标签,也能增加网络对相结构的敏感性。我们通过与直接数值估计的临界温度和渗流阈值的比较来验证机器学习的预测。 我们的结果表明,合成、结构化和计算高效的训练方案可以揭示复杂的系统中具有物理意义的相边界。该框架提供了比传统方法成本更低且更稳健的替代方案,在更广泛的凝聚态物理和统计物理学背景下具有潜在应用价值。
发布时间: 5/16/2025
查看原文
作者: Aryan Mishra, Lizhen Lin
arXiv:2505.10392v1 宣告类型: cross 摘要: 图神经网络(GNNs)提供了一种在图形结构化数据上进行学习的原理性框架,但它们的表达能力往往受到过度挤压的阻碍,在这种情况下,来自远处节点的信息被压缩成固定大小的向量。现有的解决方案,包括图重布线和瓶颈抵抗架构如Cayley图和扩张图,避免了这个问题但引入了可扩展性瓶颈。特别是,基于$SL(2,\mathbb{Z}_n)$构建的Cayley图具有很强的理论性质,但节点增长呈立方阶$O(n^3)$,导致高内存使用。为了解决这个问题,这项工作引入了Schrier-Coset图传播(SCGP),这是一种群论增强方法,通过Schreier-coset嵌入丰富节点特征而不改变输入图的拓扑结构。SCGP将无瓶颈连接模式嵌入到紧凑的特征空间中,提高了长距离消息传递能力同时保持计算效率。在标准节点分类和图分类基准上的实证评估表明,SCGP在性能上与扩张图和重布线GNN基线相当甚至超越。此外,SCGP在处理分层和模块化图结构方面表现出特别的优势,提供较低的推理延迟、更好的可扩展性和低内存占用,使其适用于实时和资源受限的应用。
发布时间: 5/16/2025
查看原文
作者: Artem Agafonov, Konstantin Yakovlev
arXiv:2505.10387v1 宣告类型: cross 摘要: 多智能体路径规划(MAPF)问题要求在一个图上找到一系列路径,使得当这些智能体同步遵循这些路径时,它们永远不会遇到冲突。在最普遍的MAPF形式化中,即所谓的经典MAPF,忽视了智能体的大小,并考虑了两种类型的冲突:占据同一顶点或在同一时间步使用同一边。而在许多实际应用中,例如在机器人技术中,考虑到智能体的大小是确保可以获得安全执行的MAPF解决方案的关键。引入大型智能体会导致一种额外类型的冲突,当一个智能体遵循一条边,其身体与另一台实际上未使用这条边(例如停留在图中其他顶点)的智能体的身体重叠时产生。迄今为止,还未清楚当在规划时考虑这种冲突时问题变得有多么困难。具体来说,已知在无向图上解决经典MAPF问题是可以在多项式时间内完成的,但是尚未提出完整的多项式时间算法来解决具有大型智能体的MAPF问题。在这篇论文中,我们首次证明了后者问题是NP难的,并且如果不等式P≠NP成立,这种问题将不可能有高效的多项式时间算法。我们的证明基于该领域常用的将经典3SAT问题(众所周知是一个NP完全问题)归约到当前问题的方法。特别是,对于任意的3SAT公式,我们按程序构建一个专用的图及其特定的起始和目标顶点,并证明给定的3SAT公式是可满足的当且仅当相应的路径规划实例有解。
发布时间: 5/16/2025
查看原文
作者: Rui Melo, Claudia Mamede, Andre Catarino, Rui Abreu, Henrique Lopes Cardoso
arXiv:2505.10375v1 安全问题类别: 交叉学科 摘要: 缓冲区溢出和SQL注入等软件漏洞是安全漏洞的主要来源。传统漏洞检测方法仍然至关重要,但这些方法受限于高误报率、可扩展性问题以及对人工努力的依赖。这些限制推动了对基于AI的自动漏洞检测和安全代码生成方法的兴趣。虽然大型语言模型(LLMs)为分类任务打开了新的途径,但它们的复杂性和不透明性给可解释性和部署带来了挑战。稀疏自编码器为解决这一问题提供了有希望的解决方案。我们探索了稀疏自编码器是否可以作为轻量级、可解释的替代品用于Java函数中的漏洞检测。我们评估了将稀疏自编码器应用于GPT-2 Small和Gemma 2B的表示时的效果,检查了它们在无需微调底层LLM的情况下突出显示错误行为的能力。我们发现,稀疏自编码器衍生的特征使漏洞检测的F1分数达到了最高89%,并且在所有情况下都优于微调的变换器编码器基线。我们的工作提供了第一个实验证据,表明可以使用稀疏自编码器从预训练的LLM的内部表示直接检测软件漏洞,而无需任何微调或特定于任务的监督。
发布时间: 5/16/2025
查看原文
作者: Kai Sun, Peibo Duan, Levin Kuhlmann, Beilun Wang, Bin Zhang
arXiv:2505.10371v1 宣告类型: cross 摘要: 突触神经网络(SNN)因其能效高、事件驱动的处理和生物可行性而受到了越来越多的关注。通过反向传播训练SNN时,使用替代梯度来近似非可微的尖峰函数,但这些替代梯度仅在膜电位接近放电阈值的狭窄范围内保持非零导数,这被称为替代梯度支持宽度γ。我们识别出一个主要挑战,称为γ的两难困境:相对较大的γ会导致过度激活,表现为神经元的过度放电,这反过来增加了能耗,而较小的γ会导致梯度消失并减弱时间依赖性。为了解决这一问题,我们提出了一种时间抑制性泄漏积分-放电(ILIF)神经元模型,受生物抑制机制的启发。该模型结合了相互连接的抑制单元以调节膜电位和电流,有效地缓解了过度激活,同时保持梯度传播。理论分析表明,ILIF在克服γ的两难困境方面表现出色,而广泛的多数据集实验显示,ILIF通过降低放电率提高能效,稳定训练并提高准确性。代码可在github.com/kaisun1/ILIF找到。
发布时间: 5/16/2025
查看原文
作者: Victor Petr\'en Bach Hansen, Lasse Krogsb{\o}ll, Jonas Lyngs{\o}, Mathias Baltzersen, Andreas Motzfeldt, Kevin Pelgrims, Lars Maal{\o}e
arXiv:2505.10360v1 Announce Type: cross 摘要:现在有多种AI写作解决方案用于医疗保健,承诺利用大规模语言模型进行环境文档记录。然而,这些AI撰稿人仍然依赖于在咨询结束后的一次性或少量提示生成笔记,几乎没有推理过程。这增加了长笔记、误导对临床医生意图的误解以及对临床医生校对错误的依赖的风险。如果工作量和疲劳削弱了警觉性,这将对患者安全构成危险的组合。在本文中,我们介绍了一种在医疗保健咨询过程中实时提取相关临床信息的方法,称之为Facts,并使用这些信息递归地生成最终笔记。FactsR方法通过将临床医生纳入笔记生成过程,从而生成更准确和简洁的笔记,同时为实时决策支持开辟新的用途。
发布时间: 5/16/2025
查看原文
作者: Shihao Zou, Qingfeng Li, Wei Ji, Jingjing Li, Yongkui Yang, Guoqi Li, Chao Dong
arXiv:2505.10352v1 类型: cross 摘要:脉冲神经网络(SNNs)在各种视觉任务中展示了与人工神经网络(ANNs)相媲美的性能,同时具备出色的能量效率。然而,现有的基于SNN的Transformer主要集中在单图像任务上,强调空间特征,但未能充分利用SNN在基于视频的视觉任务中的高效性。在本文中,我们引入了SpikeVideoFormer,这是一种高效的由脉冲驱动的视频Transformer,特征为线性时间复杂度$\mathcal{O}(T)$。具体而言,我们设计了一种由脉冲驱动的汉明注意力(SDHA),从传统的实值注意力过渡到由脉冲驱动的注意力提供了理论指导的适应。基于SDHA,我们进一步分析了各种由脉冲驱动的空间-时间注意力设计,并确定了一种最优方案,该方案在保持线性时间复杂度的同时,为视频任务提供了令人满意的性能。我们的模型在多种下游视频任务上的泛化能力和效率得到了验证,包括分类、人体姿态跟踪和语义分割。实验证明,与现有的SNN方法相比,我们的方法在后两个任务上取得了超过15%的性能提升,同时与最近的ANN基方法的表现相当,并在三项任务上实现了$\times 16$、$\times 10$和$\times 5$的效率提升。更多详细信息参见:https://github.com/JimmyZou/SpikeVideoFormer
发布时间: 5/16/2025
查看原文
arXiv:2505.10347v1 交叉公告类型 摘要:专门的多任务优化器(SMTOs)通过解决冲突梯度和梯度范数差异等问题,在多任务学习中平衡任务学习,从而克服了等权重训练任务的障碍。然而,近期的批评指出,等权重的任务可以与SMTOs达到竞争力的结果,并且早前的SMTO结果可能受到了较差的超参数优化和缺乏正则化的影响。在这项工作中,我们通过在更复杂多任务问题上广泛的经验评估,包括最新的方法,来评估这些观点,以澄清这种行为。我们的发现表明,与均匀损失相比,SMTOs表现出色;固定权重也可以与SMTOs达到竞争力的表现。此外,我们展示了在某些情况下,均匀损失为何能与SMTOs表现相似的原因。该代码将公开提供。
发布时间: 5/16/2025
查看原文
作者: Luca Muscarnera, Luigi Loreti, Giovanni Todeschini, Alessio Fumagalli, Francesco Regazzoni
arXiv:2505.10331v1 类型: cross 摘要:在数据科学和机器学习的众多应用中,随机性无所不在。令人惊讶的是,由随机组件组成的系统往往会表现出涌现的全局行为,这些行为看似确定,表现出从微观尺度的无序到宏观尺度的有序的转变。在这项工作中,我们引入了一个理论模型来研究随机分类器集合中集体行为的出现。我们argue(认为)如果通过采用分类损失作为能量的吉布斯度量对集合进行加权,那么该分布存在一个有限的温度参数,使得分类相对于损失(或者能量)是最佳的。有趣的是,在样本由高斯分布生成且标签通过使用教师感知器构建的情况下,我们通过分析证明并通过数值验证了这种最优温度既不依赖于教师分类器(由于学习问题的构造,它是未知的),也不依赖于随机分类器的数量,突显了观察到的行为的普适性。MNIST数据集上的实验强调了这种现象在高质量、无噪声数据集中的重要性。最后,一个物理类比使我们能够揭示所研究现象的自我组织性质。
发布时间: 5/16/2025
查看原文