arXiv 论文列表

扩散模型中的注意力：一个综述

作者: Litao Hua, Fan Liu, Jie Su, Xingyu Miao, Zizhou Ouyang, Zeyu Wang, Runze Hu, Zhenyu Wen, Bing Zhai, Yang Long, Haoran Duan, Yuan Zhou

arXiv:2504.03738v1 宣布类型: cross 摘要：注意机制已成为扩散模型中的基础组件，显著影响了其在各种生成和判别任务中的能力。本文对扩散模型中的注意机制进行了全面回顾，系统分析了其在不同模态和任务中的角色、设计模式和操作。我们提出了一种统一的分类法，根据它们影响的结构组件将注意力相关的修改分为不同的部分，提供了一个清晰的视角来理解它们的功能多样性。除了回顾架构创新之外，我们还探讨了注意机制如何在各种应用中推动性能提升。我们还识别了当前的局限性和未充分探索的领域，并概述了未来研究的潜在方向。我们的研究为扩散模型不断演变的景观提供了有价值的见解，特别是在注意机制的整合和普遍作用方面进行了特别关注。

发布时间: 4/8/2025

查看原文

XAI 中的不确定性传播：分析估计器与经验估计器的比较

作者: Teodor Chiaburu, Felix Bie{\ss}mann, Frank Hau{\ss}er

arXiv:2504.03736v1 公告类型：交叉学科摘要：理解可解释人工智能（XAI）中的不确定性对于在机器学习模型中建立信任并确保可靠决策至关重要。本文提出了一种统一框架，通过定义一个一般解释函数 $e_{\theta}(x, f)$，该函数捕捉来自关键来源的不确定性的传播：输入数据和模型参数的扰动。通过使用解释方差的分析估计和经验估计，我们提供了一种系统的方法来评估不确定性对解释的影响。我们使用一阶不确定性传播作为分析估计的示例说明了该方法。在跨多个异构数据集的全面评估中，我们将分析估计和经验估计的不确定性传播进行比较，并评估它们的鲁棒性。扩展了关于解释中不一致性的工作，我们的实验识别出不能可靠地捕捉和传播不确定性的XAI方法。我们的研究结果强调了在高风险应用中不确定性意识解释的重要性，并提供了当前XAI方法局限性的新见解。实验代码可以在我们的代码库中找到：https://github.com/TeodorChiaburu/UXAI

发布时间: 4/8/2025

查看原文

角色错位，图像误放：结构性输入扰动揭示多模态对齐盲区

作者: Erfan Shayegani, G M Shahariar, Sara Abdali, Lei Yu, Nael Abu-Ghazaleh, Yue Dong

arXiv:2504.03735v1 宣传类型：交叉摘要：多模态语言模型（MMLMs）通常在训练后进行对齐以防止生成有害内容。然而，这些对齐阶段主要关注助手的角色，从而使用户的角色未进行对齐，并坚持使用特殊标记的固定输入提示结构，当输入偏离这些期望时，使模型变得脆弱。我们提出了角色-模态攻击（RMA），这是一种新的对抗性攻击类别，利用用户和助手之间的角色混淆，并改变图像标记的位置以引发有害输出。与现有修改查询内容的攻击不同，RMA在不改变查询本身的情况下操纵输入结构。我们在多个视觉语言模型（VLMs）上系统地评估了这些攻击，共八个不同的设置，显示这些攻击可以被组合以生成更强的对抗性提示，这也从它们在残差流中朝否定拒绝方向的增加投影中得到验证，这是之前成功攻击中观察到的特性。最后，在缓解方面，我们提出了一个对抗性训练方法，使模型能够抵抗输入提示扰动。通过在有害和良性提示范围内进行训练，并使用不同的RMA设置对这些提示进行扰动，该模型对角色混淆和模态操纵攻击的敏感性降低，并被训练成只注意输入提示结构中的查询内容，从而有效地减少了攻击成功率（ASR），同时保留了模型的总体适用性。

发布时间: 4/8/2025

查看原文

人工地理加权神经网络：一种带有地理加权层的空间分析新型框架

作者: Jianfei Cao, Dongchao Wang

arXiv:2504.03734v1 交叉公告类型: cross 摘要: 地理加权回归（GWR）是一种广泛认可的空间异质性建模技术。然而，通常假设自变量和因变量之间的关系是线性的。为了克服这一限制，我们提出了一种人工地理加权神经网络（AGWNN），这是一种将地理加权技术与神经网络结合起来的新框架，以捕捉复杂的非线性空间关系。该框架的核心是地理加权层（GWL），这是一种专门设计用来在神经网络结构中编码空间异质性的特殊组件。为了严格评估AGWNN的性能，我们使用模拟数据集和实际案例研究进行了全面的实验。我们的结果表明，AGWNN在模型拟合精度方面显著优于传统的GWR和标准的人工神经网络（ANNs）。值得注意的是，AGWNN在建模复杂非线性关系方面表现出色，并且能够有效地识别复杂的空间异质性模式，提供了一种稳健且多用途的工具，用于高级空间分析。

发布时间: 4/8/2025

查看原文

人工智能与深度学习算法在表观遗传序列分析中的应用：表观遗传学家与AI专家的综述

作者: Muhammad Tahir, Mahboobeh Norouzi, Shehroz S. Khan, James R. Davie, Soichiro Yamanaka, Ahmed Ashraf

arXiv:2504.03733v1 交叉类型: cross 摘要：表观遗传学涵盖了不改变基础遗传序列的情况下可以改变基因表达的机制。表观遗传调控基因表达是由DNA甲基化、组蛋白修饰、染色质构型以及非编码RNA等多种机制启动和维持的。基因调控和表达的变化可以表现为各种疾病和异常，如癌症和先天性畸形。在过去的几十年里，高通量实验方法被用于识别和理解表观遗传变化，但这些实验室实验方法和生化过程耗时且昂贵。为了克服这些挑战，机器学习和人工智能（AI）方法已被广泛用于将表观遗传修饰与其表型表现进行映射。在本文中，我们对基于表观基因组数据训练的AI模型进行了一篇综述，以解决包括疾病标志物预测、基因表达、增强子启动子相互作用以及染色质状态等各种问题。本文的目的双管齐下：一是面向AI专家，二是面向表观遗传学家。对于AI研究人员，我们提供了一个表观遗传研究问题的分类，这些问题是可以从基于AI的方法中获益的。对于表观遗传学家，对于上述每一个问题，我们提供了文献中提出的一些候选AI解决方案。我们还指出了文献中存在的若干空白、研究挑战以及应对这些挑战的建议。

发布时间: 4/8/2025

查看原文

通过模拟交互检测恶意AI代理

作者: Yulu Pi, Ella Bettison, Anna Becker

arXiv:2504.03726v1 类别:交叉摘要：本研究探讨了恶意AI助手的操控性特征，以及在与具备人类相似特性的模拟用户互动的不同决策情境下，恶意AI助手的行为是否可以被检测。我们还研究了互动的深度和规划能力对恶意AI助手的操控策略及其有效性的影响。通过受控实验设计，我们模拟了在不同复杂度和利害关系的八种决策情境下，AI助手（包括良性及故意恶意的）与用户的互动。我们的方法使用了两款最先进的语言模型生成互动数据，并采用了意图感知提示（IAP）来检测恶意AI助手。研究发现，恶意AI助手采用特定领域的个性化操控策略，利用模拟用户的心理弱点和情绪触发点。具体来说，模拟用户在互动初期表现出对操控的抵抗力，但随着互动深度的增加，越来越容易受到恶意AI助手的影响，突显了长期接触可能出现操控行为的系统所面临的重要风险。IAP检测方法实现了高精度且无误报，但难以检测许多恶意AI助手，导致高误检率。这些发现凸显了人类与AI互动中的关键风险，并强调了在日益自主的决策支持系统中，需要对操控性AI行为实施稳健、情境敏感的防护措施的重要性。

发布时间: 4/8/2025

查看原文

一种针对严格延迟约束资源调度的混合强化学习框架

作者: Luyuan Zhang, An Liu, Kexuan Wang

arXiv:2504.03721v1 Announce Type: cross 摘要：在即将到来的6G时代，扩展现实(XR)被视为超可靠和低延迟通信(URLLC)的一种新兴应用，具有新的流量特性和更严格的要求。除了XR中的准周期性流量外，在某些真实世界的低延迟通信场景中，具有大帧尺寸和随机到达的突发流量已经成为网络拥塞甚至崩溃的主要原因，而且仍然缺乏在具有严格延迟约束的突发流量下有效的资源调度算法。我们提出了一种新的混合强化学习框架，该框架结合了从其他相似环境和基于领域知识(DK)的政策中学习到的策略以及使用专家知识构建的DK策略，以提高性能。策略重用概率和新策略的联合优化被形式化为一个马尔可夫决策过程(MDP)，该过程最大化用户的严格延迟约束有效吞吐量(HLC-ET)。我们证明了所提出的HRL-RSHLC可以从任一初始点收敛至KKT点。仿真结果显示，与基线算法相比，HRL-RSHLC在收敛速度方面具有更好的性能。

发布时间: 4/8/2025

查看原文

向量化的低秩适配器研究

作者: Tales Panoutsos, Rodrygo L. T. Santos, Flavio Figueiredo

arXiv:2504.03719v1 优化类型: 交叉摘要: \newcommand{\mathds}[1]{\text{\usefont{U}{dsrom}{m}{n}#1}} 在本文中，我们介绍了对称低秩适配器（Symmetric Low-Rank Adapters），这是LoRA的一种优化变体，具有更少的权重。该方法利用低秩对称权重矩阵以更高效的方式学习下游任务。传统的LoRA通过类似于奇异值分解（SVD）的方法将微调权重与原始预训练权重积累起来，即模型权重通过形式为$BA$的形式进行微调（其中$B \in \mathbb{R}^{n\times r}$，$A \in \mathbb{R}^{r\times n}$，$r$是合并权重矩阵的秩）。相反，我们的方法，称为SymLoRA，将微调权重表示为谱分解的形式，即$Q \, diag(\Lambda)\, Q^T$，其中$Q \in \mathbb{R}^{n\times r}$，$\Lambda \in \mathbb{R}^r$。SymLoRA需要大约一半的微调权重。在这里，我们展示了这种方法在下游效果上的损失可以忽略不计。

发布时间: 4/8/2025

查看原文

针对任务的参数高效微调大预训练模型在边缘设备上

作者: Senkang Hu, Yanan Ma, Yihang Tao, Zhengru Fang, Zihan Fang, Yiqin Deng, Sam Kwong, Yuguang Fang

arXiv:2504.03718v1 类型: cross 摘要：大型语言模型（LLMs）在决策制定、推理和问答等各种任务中取得了显著的成功，并且已经在边缘设备上得到了广泛应用。然而，由于边缘设备上的高计算成本以及有限的存储和能源资源，针对特定任务对LLMs进行微调仍然是一个挑战。为此，我们提出了TaskEdge，这是一种适用于边缘设备的任务感知参数高效微调框架，该框架将最有效的参数分配给目标任务，并仅更新特定于任务的参数。具体来说，我们首先设计了一个参数重要性计算标准，该标准将权重和输入激活都纳入了权重重要性的计算中。然后，我们提出了一种模型无关的任务特定参数分配算法，以确保特定于任务的参数能够在模型中均匀分布，而不是集中于特定区域。通过这样做，TaskEdge可以在更新不到0.1%的参数的情况下，显著降低计算成本和内存使用量，同时在下游目标任务上保持性能。此外，TaskEdge可以轻松集成到结构化稀疏性中，从而利用 NVIDIA 的专门稀疏张量核实现加速，还可以无缝集成 LoRA，以实现高效的稀疏低秩适应。在各种任务上的 extensive 实验表明了 TaskEdge 的有效性。

发布时间: 4/8/2025

查看原文

RaanA：一种快速、灵活且数据高效的后训练量化算法

作者: Yongyi Yang, Jianyang Gao, Wei Hu

arXiv:2504.03717v1 类型: cross 摘要: 后训练量化（PTQ）已成为提高大型语言模型（LLMs）推理效率的一种广泛使用的技术。然而，现有的PTQ方法通常遭受一些关键限制，如对大量校准数据的需求以及目标位数选择的灵活性较低。本文中，我们提出了一种名为RaanA的统一PTQ框架，通过引入两种新颖的组件来克服这些挑战：1) RaBitQ-H，这是随机向量量化方法RaBitQ的一种变体，旨在实现快速、准确且高效的量化；以及2) AllocateBits，这是一种基于其量化敏感性的算法，用于在各层之间优化分配位宽。RaanA在保持与最新量化方法竞争力的同时，执行速度极快，需要少量的校准数据，并允许灵活的位宽分配。广泛的实验表明，RaanA在效率和准确性的平衡方面具有有效性。代码已公开发布在https://github.com/FFTYYY/RaanA 。

发布时间: 4/8/2025

查看原文