arXiv 论文列表

作者: Jakub {\L}ucki, Boyi Wei, Yangsibo Huang, Peter Henderson, Florian Tram\`er, Javier Rando

arXiv:2409.18025v5 通知书类型: replace-cross 摘要：大型语言模型被微调以拒绝关于危险知识的问题，但这些保护措施往往可以被绕过。遗忘方法旨在完全去除模型中的危险能力，并使其对对手而言不可访问。本工作从对手的角度挑战了遗忘与传统训练后安全措施之间基础性的差异。我们证明，以前报道为对遗忘无效的方法，如果谨慎应用，可以取得成功。此外，我们开发了一种适应性方法的多种变体，以恢复大部分被认为已遗忘的能力。例如，我们展示了使用RMU（一种最先进的遗忘方法）编辑的模型，通过对10个无关示例进行微调或移除激活空间中的特定方向，可以恢复大部分危险能力。我们的发现挑战了当前遗忘方法的稳健性，并对其相对于安全训练的优势提出了质疑。

发布时间: 4/11/2025

查看原文

ID-Guard: 一种通过打破识别来进行面部篡改对抗的通用框架

作者: Zuomin Qu, Wei Lu, Xiangyang Luo, Qian Wang, Xiaochun Cao

arXiv:2409.13349v2 通知类型: 交叉替换摘要：基于深度学习的面部操控的滥用对公民权利构成了重大威胁。为了在源头上防止这种欺诈行为，已经提出了主动防御方法，通过向图片中添加不可见的对抗性扰动来破坏操控过程，使伪造的输出对观察者来说不具说服力。然而，对输出的非特定破坏可能会保留可识别的面部特征，从而可能导致个体受到污名化。本文提出了一种通用框架，称作ID-Guard，用于应对面部操控。具体而言，该框架利用编码-解码网络的一次前向传播过程，生成跨模型转移的对抗性扰动。引入了一种新的身份破坏模块(IDM)，用于降解伪造面部中的可识别特征。通过将对不同面部操控的破坏视为一个多任务学习问题来优化扰动的生成，并且设计了一种动态权重策略以增强跨模型性能。实验结果表明，提出的ID-Guard在对抗各种面部操控模型方面表现出强大的防御效果，有效地降解了操控图片中的可识别区域。它还使被破坏的图片能够逃避面部修复和图像识别系统。此外，ID-Guard可以无缝地用作即插即用组件，与其他任务如对抗性训练等整合。

发布时间: 4/11/2025

查看原文

基于反事实对比学习的鲁棒图像表示

作者: M\'elanie Roschewitz, Fabio De Sousa Ribeiro, Tian Xia, Galvin Khara, Ben Glocker

arXiv:2409.10365v2 宣告类型: replace-cross 摘要：对比预训练可以显著提高模型的泛化能力和下游性能。然而，学到的表示的质量高度依赖于用于生成正样本对的数据增强策略。正对比样本应该保留语义意义，同时丢弃与数据采集领域相关的不需要的变化。传统对比预训练管道试图通过预定义的通用图像变换来模拟领域转换。然而，这些方法并不总是模拟医疗成像中真实且相关的领域变化，例如扫描仪差异。为了应对这一问题，我们在此引入了反事实对比学习，这是一种新颖的框架，利用了最近在因果图像合成方面取得的进展，以创建能够准确捕捉相关领域变化的对比正样本对。我们的方法在涵盖了胸部X光摄影和乳腺摄影数据的五个数据集中进行了评估，并针对两种已建立的对比目标（SimCLR和DINO-v2）表现出了对采集变换的鲁棒性。值得注意的是，反事实对比学习在内部和外部数据集上的下游性能表现更优，尤其是在训练集中代表性不足的扫描仪采集的图像上。进一步的实验表明，所提出的方法超越了采集变换，使用反事实对比学习训练的模型减少了不同性别亚组之间的差异。

发布时间: 4/11/2025

查看原文

人工 intelligence 披露 (AID) 框架：简介

作者: Kari D. Weaver

arXiv:2408.01904v2 公告类型: replace-cross 摘要：随着生成人工智能工具在高等教育和研究中的应用日益增多，对这些工具的使用和归因透明度和细节的需求也在增加。迄今为止，这种需求主要通过推荐包含一个说明来满足，但几乎没有提供关于说明本身应包含哪些内容的指导。这被认定为在学术和研究环境中使用人工智能的问题。本文介绍了《人工智能披露框架》（AID Framework），这是一个标准、全面且详细的框架，旨在指导教育和研究中的生成人工智能（GenAI）披露的发展和撰写。

发布时间: 4/11/2025

查看原文

机器人应用中行为树的执行语义

作者: Enrico Ghiorzi, Christian Henkel, Matteo Palmas, Michaela Klauck, Armando Tacchella

arXiv:2408.00090v2 宣告类型: replace-cross 摘要: 行为树(BTs)由于其吸引人的特性，易于使用作为控制策略的概念模型，以及可用于基于行为树设计控制软件的软件工具，已经在机器人技术中得到了广泛的应用。然而，行为树没有正式的执行语义，而且不同实现中的微妙差异可能导致相同的模型因底层软件的不同而表现出不同的行为。本文旨在定义机器人应用中使用的行为树的执行语义。为此，我们提出了一种抽象数据类型，该类型形式化了行为树的结构和执行。虽然我们的形式化受到了科学文献中现有贡献和先进实现的启发，但我们力求为大多数其他工作中处理不完整或不一致的特性提供明确的处理。

发布时间: 4/11/2025

查看原文

近似费舍尔影响函数：更快的数据影响估计在统计模型中的应用

作者: Omri Lev, Ashia C. Wilson

arXiv:2407.08169v2 宣告类型: replace-cross 摘要: 量化 infinitesimal 变化在训练数据上对模型性能的影响是理解并改进机器学习模型的关键。在本文中，我们将这个问题重新表述为加权经验风险最小化，并通过使用信息几何增强现有的基于影响函数的方法，以推导出一种新的算法来估计影响。我们的表述在各种应用中表现出高度的灵活性，并且我们在模拟中进一步证明了即使在非凸情况下，它仍然具有信息价值。此外，我们展示了我们的方法在计算效率上显著优于当前基于牛顿步的方法。

发布时间: 4/11/2025

查看原文

重新考虑常规、自我解释和领域不变的GNN中的忠诚度

作者: Steve Azzolin, Antonio Longa, Stefano Teso, Andrea Passerini

arXiv:2406.15156v2 宣告类型: replace-cross 摘要：随着图神经网络（GNNs）变得越来越普遍，建立可靠的工具来解释其预测结果变得至关重要。一个核心要求是解释要具有\textit{可靠性}，即它们能够准确地反映GNN的推理过程。但是，存在多种不同的可靠性度量标准，这就提出了什么是可靠性以及如何实现它的问题。我们做出了三项关键贡献。我们首先展示了\textit{现有的度量标准并不是互换的}——也就是说，根据一个度量标准获得高可靠性的解释在其他度量标准下可能是不可靠的，这些度量标准会系统地忽略解释的重要属性。接着我们展示了，令人惊讶的是，\textit{优化可靠性并不是总是明智的设计目标}。具体来说，我们证明对于注入性的标准GNN架构，完美可靠的解释是完全无信息的。这并不适用于模块化的GNN，如自我解释和领域不变架构，这促使我们研究架构选择与可靠性之间的关系。最后，我们展示了\textit{可靠性与离分布外泛化紧密相关}，即仅仅确保GNN能够正确识别由文献规定的领域不变子图，并不保证它是不可变的，除非该子图本身也是可靠的。代码已在GitHub上公开。

发布时间: 4/11/2025

查看原文

DeciMamba：探索Mamba的长度外推潜力

作者: Assaf Ben-Kish, Itamar Zimerman, Shady Abu-Hussein, Nadav Cohen, Amir Globerson, Lior Wolf, Raja Giryes

arXiv:2406.14528v3 宣告类型: replace-cross 摘要：长范围序列处理由于输入长度带来的二次复杂性，对Transformer构成了重大挑战。Mamba提供了一种有前景的替代方案，它展示了高性能并实现了与Transformer相当的能力，同时所需计算资源显著减少。在本文中，我们探讨了Mamba的长度泛化能力，发现其相对有限。通过一系列可视化和分析，我们发现限制因素来自于训练期间使用的序列长度所决定的有效感受野限制。为了解决这一约束，我们提出了DeciMamba，这是一种专门为Mamba设计的上下文扩展方法。这种方法基于S6层内部嵌入的隐藏过滤机制，使训练后的模型即使不进行额外训练也能很好地进行外推。在实际长范围自然语言处理任务上的实验证明，DeciMamba可以对外推到远超训练期间看到的上下文长度，同时享受更快的推理速度。

发布时间: 4/11/2025

查看原文

ChatEMG: 合成数据生成以控制用于中风的机器人手外矫治器

作者: Jingxi Xu, Runsheng Wang, Siqi Shang, Ava Chen, Lauren Winterbottom, To-Liang Hsu, Wenxi Chen, Khondoker Ahmed, Pedro Leandro La Rotta, Xinyue Zhu, Dawn M. Nilsen, Joel Stein, Matei Ciocarlie

arXiv:2406.12123v3 宣告类型: replace-cross 摘要：针对中风患者的手部矫形器进行意图推断具有挑战性，因为数据收集困难。此外，EMG信号在不同条件下、不同会话和不同受试者之间表现出显著的差异变化，使得分类器难以泛化。传统方法需要从新的条件、会话或受试者中收集大量标注数据来训练意图分类器；然而，这一数据收集过程既繁重又耗时。在本文中，我们提出了一种自回归生成模型ChatEMG，它可以基于提示（即给定的一系列EMG信号）生成合成的EMG信号。ChatEMG使我们能够仅从新条件、会话或受试者中收集一小部分数据，并通过基于此新的上下文的提示生成的样本扩展这些数据。ChatEMG通过生成性训练利用了大量先前的数据，同时仍保持上下文特定性通过提示。我们的实验表明，这些合成样本对分类器是无偏的，并且可以提高不同类型分类器的意图推断准确性。我们展示了我们的完整方法可以集成到单个患者会话中，包括使用分类器进行功能性矫形器辅助任务。据我们所知，这是首次将部分基于合成数据训练的意图分类器应用于中风幸存者对矫形器的功能控制。更多视频、源代码和附加信息可以在 https://jxu.ai/chatemg。

发布时间: 4/11/2025

查看原文

基于潜在场的深度度量学习

作者: Shubhang Bhatnagar, Narendra Ahuja

arXiv:2405.18560v3 宣布类型: 替换交叉摘要：深度度量学习（DML）涉及训练一个网络以学习一个语义上有意义的表示空间。许多当前的方法提取n元组的示例并对每个元组内的相互作用进行建模。我们提出了一种新颖的、组合式的DML模型，该模型不是以元组的形式表示每个示例（嵌入）的影响，而是通过一个连续的潜在场来表示每个示例的影响，并叠加这些场以获得它们的综合全局潜在场。我们使用吸引性和排斥性潜在场来表示来自同一类别或不同类别的图像嵌入之间的相互作用。与典型的学习方法不同，这种相互影响的程度与样本之间的距离成正比，我们强制这种影响随距离而减少，从而产生一个递减的场。我们展示了这种递减有助于在具有大类内变化和标签噪声的实际数据集上提高性能。与基于代理的方法类似，我们还使用代理来简洁地表示示例的子群体。我们在标准的DML基准数据集- Cars-196、CUB-200-2011 和 SOP 数据集上评估了该方法，结果显示该方法在最新的基线上表现出优越的性能。

发布时间: 4/11/2025

查看原文