arXiv 论文列表

作者: Yuning Jiang, Qiaoran Meng, Feiyang Shang, Nay Oo, Le Thi Hong Minh, Hoon Wei Lim, Biplab Sikdar

arXiv:2502.10825v1 通告类型: 关跨领域摘要：MITRE ATT&CK框架是广泛采用的工具，用于增强网络安全，支持威胁情报、事件响应、攻击建模和漏洞优先级设定。本文通过分析417篇同行评审的出版物，汇总了其在这些领域的应用研究。我们识别出常用的对手战术、技术和程序（TTPs），并探讨了自然语言处理（NLP）和机器学习（ML）与ATT&CK的整合，以提高威胁检测和响应效果。此外，我们还探索了ATT&CK与其他框架的互操作性，如Cyber Kill Chain、NIST指南和STRIDE，突显其灵活性。论文进一步从多个角度评估了该框架，包括其有效性、验证方法以及在工业控制系统（ICS）和医疗保健等特定行业的挑战。最后，我们讨论了当前的局限性，并提出了未来的研究方向，以增强ATT&CK在动态网络安全环境中的适用性。

发布时间: 2/18/2025

查看原文

NeuroAMP：一种新型端到端通用深度神经放大器，用于个性化助听器

作者: Shafique Ahmed, Ryandhimas E. Zezario, Hui-Guan Yuan, Amir Hussain, Hsin-Min Wang, Wei-Ho Chung, Yu Tsao

arXiv:2502.10822v1 Announce Type: cross 摘要：助听器的普及率正在增加。然而，由于传统方法中集成多个模块化组件的复杂性，在助听器中优化放大过程仍然具有挑战性。为了解决这一挑战，我们提出了一种名为NeuroAMP的新颖的端到端个性化助听器放大深度神经网络。NeuroAMP利用了频谱特征和听众的听力图作为输入，并研究了四种架构：卷积神经网络（CNN）、长短期记忆（LSTM）、卷积循环神经网络（CRNN）和变压器。我们还介绍了去噪NeuroAMP的扩展，该扩展结合了降噪和放大功能，以在实际场景中提高表现。为了增强泛化能力，我们在包含不同语音（TIMIT和TMHINT）和音乐（Cadenza Challenge MUSIC）的数据集上进行训练时，采用了一种全面的数据增强策略。使用助听器言语感知指数（HASPI）、助听器言语质量指数（HASQI）和助听器音频质量指数（HAAQI）进行评估，结果显示NeuroAMP内的变压器架构在TIMIT数据集上取得了最佳性能，HASQI得分为0.9927，HASPI得分为0.9905；在Cadenza Challenge MUSIC数据集上HAAQI得分为0.9738。值得注意的是，我们的数据增强策略在未见数据集（例如VCTK、MUSDB18-HQ）上保持了高性能。此外，Denoising NeuroAMP在VoiceBank+DEMAND数据集上优于传统的NAL-R+WDRC方法和两阶段基线，分别在HASPI（0.90）和HASQI（0.59）得分上提高了10%。这些结果显示NeuroAMP和Denoising NeuroAMP在个性化助听器放大方面具有显著改进的潜力。

发布时间: 2/18/2025

查看原文

关于梯度消退、过度平滑和过度压缩在GNN中的问题：连接递归学习与图学习

作者: \'Alvaro Arroyo, Alessio Gravina, Benjamin Gutteridge, Federico Barbero, Claudio Gallicchio, Xiaowen Dong, Michael Bronstein, Pierre Vandergheynst

arXiv:2502.10818v1 类型:交叉摘要:图神经网络（GNNs）是利用图结构在节点之间传递信息的模型，通常通过消息传递操作实现。虽然广为成功，但这种方法众所周知地会遭受过度平滑和过度压缩的现象，随着层数的增加，这两种现象会导致表示崩溃，并且分别对远处和连接较差的节点中包含的信息不够敏感。在本文中，我们通过消失梯度的角度，从线性控制理论的概念出发，统一地看待这些问题。我们提出了一种将GNNs解释为递归模型的视角，并通过简单的状态空间公式有效地解决了过平滑和过度压缩的问题，而无需额外的可训练参数。此外，我们从理论上和实验上证明了：(i) GNNs即使在几层之后，设计上也容易遭受极端的梯度消失；(ii) 过平滑直接与导致梯度消失的机制相关；(iii) 通过图重布和梯度消失缓解的结合，过度压缩最易于解决。我们认为我们的工作将有助于弥合递归和图神经网络文献之间的差距，并将为设计新的深层和高性能的GNNs解锁新的可能性。

发布时间: 2/18/2025

查看原文

不平衡学习基准：一种不平衡学习综述

作者: Shaoxuan Xu, Menglu Cui, Chengxiang Huang, Hongfa Wang, DiHu

arXiv:2502.10816v1 交叉公告类型：多模态学习摘要：多模态学习因其能够整合不同模态的信息而受到关注。然而，它常常受到多模态不平衡问题的阻碍，某些模态占主导地位，而其他模态则未得到充分利用。尽管最近的研究提出了各种缓解这一问题的方法，但这些方法缺乏全面和公平的比较。在本文中，我们基于它们缓解不平衡所采用的策略，系统地将多种主流多模态不平衡算法分为四组。为了促进对这些方法的全面评估，我们引入了BalanceBenchmark，这是一个基准，包括多个广泛使用的多维度数据集和从三个视角（性能、不平衡程度和复杂性）的评估指标。为了确保公平的比较，我们开发了一个模块化和可扩展的工具箱，标准化了不同方法的实验流程。基于BalanceBenchmark的实验，我们对不同方法组在性能、平衡程度和计算复杂性方面的特性和优势有了几个关键的见解。我们期望这种分析能够启发未来更有效的解决不平衡问题的方法，以及基础模型的方法。工具箱的代码可在https://github.com/GeWu-Lab/BalanceBenchmark获取。

发布时间: 2/18/2025

查看原文

HybriDNA：一种混合Transformer-Mamba2长范围DNA语言模型

作者: Mingqian Ma, Guoqing Liu, Chuan Cao, Pan Deng, Tri Dao, Albert Gu, Peiran Jin, Zhao Yang, Yingce Xia, Renqian Luo, Pipi Hu, Zun Wang, Yuan-Jyue Chen, Haiguang Liu, Tao Qin

arXiv:2502.10807v1 编码类型: cross 摘要：自然语言处理和大型语言模型的进步激发了对DNA建模越来越大的兴趣，常常将DNA称为“生命之语言”。然而，DNA建模带来了独特的挑战。首先，它需要处理超长DNA序列并保持单核苷酸分辨率，因为单独的核苷酸在DNA功能中起着关键作用。其次，在这一领域取得成功需要在生成性和理解性任务上都表现出色：生成性任务有望在治疗和工业应用中发挥作用，而理解性任务则提供了深入了解生物机制和疾病的关键见解。为了应对这些挑战，我们提出了HybriDNA，这是一种仅解码的DNA语言模型，结合了混合Transformer-Mamba2架构，无缝地将注意力机制的优势与选择性状态空间模型的优势结合起来。这种混合设计使HybriDNA能够高效处理长达131kb的DNA序列，并保持单核苷酸分辨率。HybriDNA在BEND、GUE和LRB基准中收集的33个DNA理解数据集中达到了最先进的性能，并展示了在生成具有所需属性的顺式调节元件（CREs）方面的出色能力。此外，我们表明HybriDNA遵循预期的扩展法则，性能随着模型参数从300M、3B和7B逐渐增加而一致地提升。这些发现突显了HybriDNA的多功能性，并揭示了其在推进DNA研究和应用方面的潜力，为理解和工程“生命之语言”铺平了道路。

发布时间: 2/18/2025

查看原文

PDA: 通过后验分布对齐实现的AI生成图像的通用检测

作者: Li Wang, Wenyu Chen, Zheng Li, Shanqing Guo

arXiv:2502.10803v1 声明类型：交叉摘要：生成模型的迅速发展导致了高度逼真的人工智能生成图像的泛滥，这对检测方法带来了重大挑战，使其难以适应不断变化的生成技术。现有的方法往往无法在没有昂贵重训练的情况下适应未知的模型，这限制了它们的实际应用。为了解决这一问题，我们提出了事后分布对齐（PDA），这是一种用于人工智能生成图像泛化检测的新方法。其核心思想是使用已知的生成模型来重新生成未分类的测试图像。这一过程将重新生成的真实图像的分布与已知的假图像分布对齐，从而有助于有效地区分未知的假图像。PDA采用两步检测框架：1）基于深度k近邻（KNN）距离评估测试图像是否与已知假图像分布对齐，以及2）使用已知生成模型重新生成测试图像以生成伪假图像进行进一步分类。这种对齐策略使PDA能够在不依赖未见过的数据或无需重训练的情况下有效检测假图像。广泛的实验证明了PDA的优越性，它在六种最新生成模型上实现了96.73%的平均准确率，包括生成对抗网络（GANs）、扩散模型和文本到图像模型，并且比最佳基线提高了16.07%。通过t-SNE可视化和KNN距离分析，我们提供了PDA在区分真实和假图像方面的有效性洞察。我们的工作提供了一种灵活而有效的解决真实世界假图像检测问题的方案，提高了检测系统的一般化能力。

发布时间: 2/18/2025

查看原文

CoCoEvo: 共进化程序和测试用例以增强代码生成

作者: Kefan Li, Hongyue Yu, Tingyu Guo, Shijie Cao, Yuan Yuan

arXiv:2502.10802v1 类型:交叉摘要：大型语言模型（LLMs）在自动代码生成方面展现了卓越的表现。然而，现有方法往往依赖预定义的测试案例，在无法获取这些案例的情况下，变得不可行。虽然先前的工作探讨了程序和测试案例之间的过滤技术，但忽视了测试案例的细化。为解决这一局限性，我们提出了一种名为CoCoEvo的新颖的基于LLM的共进化框架，该框架同时进化程序和测试案例。CoCoEvo通过直接从自然语言问题描述和函数头部生成程序和测试案例，消除了对预定义测试案例的依赖。该框架采用专门的进化算子，包括基于LLM的交叉和变异算子用于程序进化，以及一个测试案例生成算子用于测试案例进化。此外，我们提出了优化策略，如交叉率调度器以平衡探索与收敛，以及用于测试案例选择的多目标优化方法。在多个最先进的LLM上的实验结果表明，CoCoEvo超越了现有方法，在自动代码生成和测试方面达到了最先进的性能。这些结果强调了共进化技术在推进自动化编程领域方面的潜力。

发布时间: 2/18/2025

查看原文

FaceSwapGuard：通过身份模糊化防护深度假脸威胁以保护面部隐私

作者: Li Wang, Zheng Li, Xuhong Zhang, Shouling Ji, Shanqing Guo

arXiv:2502.10801v1 安全公告类型: 交叉摘要: 深度合成对我们的社会构成了重大威胁。一项具有代表性的深度合成应用是脸部替换，它将面部图像中的身份替换为受害者的身份。虽然现有方法在一定程度上通过降低置换图像的质量来减轻这些风险，但却往往无法有效打断身份转换。为填补这一空白，我们提出了一种名为 FaceSwapGuard (FSG) 的新型黑盒防御机制，以应对深度伪造脸部替换的威胁。具体来说，FSG 在用户的面部图像中引入不可感知的扰动，以破坏身份编码器提取的特征。当这些扰动图像被在线共享时，它们会误导脸部替换技术，使其生成的身份与原始用户显著不同的面部图像。大量的实验表明，FSG 对各种脸部替换技术的有效性，使身份匹配率从无防御措施时的 90% 降至低于 10%。定性和定量研究进一步证实了其欺骗人类感知的能力，突显了其实用价值。此外，我们还研究了可能影响 FSG 的关键因素，并评估了其在面对各种适应性对手时的鲁棒性。

发布时间: 2/18/2025

查看原文

动态影响跟踪器：衡量训练过程中随时间变化的样本影响

作者: Jie Xu, Zihan Wu

arXiv:2502.10793v1 Announce Type: cross 摘要：现有的用于测量训练样本对模型影响的方法仅提供静态的整体测量，忽视了样本影响在整个训练过程中的变化情况。我们提出了一种动态影响跟踪器（DIT），它在任意时间窗口的训练过程中捕捉样本的影响随时间的变化。 DIT 提供了三个关键见解：1）样本显示了不同的时间变化影响模式，有些样本在早期训练阶段重要，而其他样本则在后来变得重要。2）样本影响在早期和晚期阶段之间表现出较弱的关联，这表明模型经历了具有不同优先级的独立学习阶段。3）在收敛期内分析影响比全训练分析更有效地检测到被污染的样本。DIT 在理论上得到了保证，无需假设损失的凸性或模型的收敛性，它显著优于现有方法，在复杂架构中与真实值的相关性高达0.99，并且在检测被污染的样本方面准确率超过98%。

发布时间: 2/18/2025

查看原文

基于蒸馏的未来意识图神经网络股票行情预测

作者: Zhipeng Liu, Peibo Duan, Mingyang Geng, Bin Zhang

arXiv:2502.10776v1 宣告类型：交叉摘要：股票趋势预测涉及通过分析历史数据和各种市场指标来预测未来的价格变动。随着机器学习的发展，由于图形神经网络（GNNs）能够捕获股票的空间时间依赖性，因此它们在股票预测中的应用越来越广泛。然而，尽管各种GNN股票预测器在提高预测性能方面做出了努力，但这些改进仍然有限，因为它们仅专注于分析历史空间时间依赖性，而忽略了历史和未来模式之间的相关性。在本研究中，我们提出了一种新颖的基于蒸馏的未来意识GNN框架（DishFT-GNN）用于股票趋势预测。具体而言，DishFT-GNN会在迭代过程中训练一个教师模型和一个学生模型。教师模型学会捕捉历史和未来数据分布变化之间的相关性，然后利用这些中间监督来指导学生模型学习未来意识的空间时间嵌入，以实现准确的预测。通过在两个真实世界数据集上的广泛实验，我们验证了DishFT-GNN的最先进的性能。

发布时间: 2/18/2025

查看原文