arXiv 论文列表

作者: Kangfu Mei, Luis Figueroa, Zhe Lin, Zhihong Ding, Scott Cohen, Vishal M. Patel

arXiv:2312.02156v2 公告类型: replace-cross 摘要: 在从阴影图像中推断出无阴影场景方面，恢复纹理一直是一个具有挑战性的问题。本文中，我们提出了使用扩散模型，因为在扩散过程中它们可以逐步细化阴影区域的细节，提供一种有希望的方法。我们的方法通过条件化一个从无阴影图像中学习到的潜在特征空间来改进这一过程，从而避免了传统方法只能条件化退化图像的局限性。此外，我们提出通过将噪声特征与扩散网络融合以缓解训练过程中潜在的局部极值问题。我们展示了这种方法的有效性，其在AISTD数据集上的RMSE方面优于之前最佳方法13%。进一步地，我们在实例级阴影去除方面进行了探索，我们的模型在DESOBA数据集上的RMSE方面优于之前最佳方法82%。

发布时间: 5/13/2025

查看原文

超越边界：面向AI系统的可转移攻击综述

作者: Guangjing Wang, Ce Zhou, Yuanda Wang, Bocheng Chen, Hanqing Guo, Qiben Yan

arXiv:2311.11796v2 Announce Type: replace-cross 摘要：随着人工智能（AI）系统在自动驾驶车辆到生物特征认证等多种关键应用中发挥愈加重要的作用，它们面临可转移攻击的脆弱性成为一个日益严重的问题。这些设计用于跨样本、领域、模型、任务、模态，甚至硬件平台进行推广的攻击，对安全、隐私和系统完整性构成了严重的风险。本文综述了可转移攻击的首次全面审查，涵盖了七个主要类别，包括欺骗、后门攻击、数据污染、模型窃取、模型反演、成员推断和旁路攻击。我们引入了一个统一的六维度分类系统的概念：跨样本、跨领域、跨模态、跨模型、跨任务和跨硬件，这个框架系统地捕捉了各种敌对策略的多样转移路径。通过这一框架，我们探讨了可转移攻击对AI系统的潜在机械原理及其实践意义。此外，我们还回顾了提高攻击可转移性的最新方法，这些方法围绕数据扩增和优化策略组织起来。通过整合碎片化的研究并识别关键的未来方向，本文提供了理解、评估和防御现实世界AI系统中的可转移威胁的基础路线图。

发布时间: 5/13/2025

查看原文

机器学习模型成员推断攻击的基本限制

作者: Eric Aubinais, Elisabeth Gassiat, Pablo Piantanida

arXiv:2310.13786v5 通知类型: 替换-交叉摘要：成员推断攻击（MIA）可以揭示特定数据点是否属于训练数据集，从而可能暴露个人的敏感信息。本文通过探索大规模机器学习模型中MIA的基本统计限制，提供了理论上的保证。更具体地说，我们首先推导出控制此类攻击有效性和成功的统计量。然后，我们理论上证明，在过拟合学习过程的非线性回归设置中，攻击可能有很高的成功率。最后，我们研究了几种情况，并提供了对该感兴趣量的界限。有趣的是，我们的发现表明，对数据进行离散化可能增强学习过程的安全性。这证明了其受一个量化基础数据分布多样性的常数限制。我们通过简单的模拟展示了这些结果。

发布时间: 5/13/2025

查看原文

理解语言模型中的拍马行为

作者: Mrinank Sharma, Meg Tong, Tomasz Korbak, David Duvenaud, Amanda Askell, Samuel R. Bowman, Newton Cheng, Esin Durmus, Zac Hatfield-Dodds, Scott R. Johnston, Shauna Kravec, Timothy Maxwell, Sam McCandlish, Kamal Ndousse, Oliver Rausch, Nicholas Schiefer, Da Yan, Miranda Zhang, Ethan Perez

arXiv:2310.13548v4 文章类型：替换交叉摘要：人类反馈通常被用于微调AI助手。但人类反馈也可能促使模型响应匹配用户的信念而非真实的事实，这种行为被称为歌功颂德。我们调查了在微调过程中使用了人类反馈的模型中歌功颂德现象的普遍性，以及人类偏好判断在该行为中可能发挥的作用。我们首先展示了五种最先进的AI助手在四种不同的自由文本生成任务中一致表现出歌功颂德的现象。为了了解人类偏好是否驱动这种广泛观察到的行为，我们分析了现有的人类偏好数据。我们发现，当响应与用户的观点相一致时，它更有可能被偏好。此外，人类和偏好模型（PMs）在一定比例的情况下都会更偏好写得有说服力的歌功颂德响应，而不是正确的响应。优化模型输出以适应PMs有时也会牺牲真实性以换取歌功颂德。总体而言，我们的结果表明，歌功颂德是最先进的AI助手的一种普遍行为，部分可能是由更偏好歌功颂德响应的人类偏好判断所驱动的。

发布时间: 5/13/2025

查看原文

复习有助于学习得更好：时间监督知识蒸馏

作者: Dongwei Wang, Zhi Han, Yanmei Wang, Xiai Chen, Baichen Liu, Yandong Tang

arXiv:2307.00811v3 宣告类型：替换交叉摘要：回顾在学习知识过程中扮演了一个重要角色。某一时刻的知识获取可能强烈地受到先前经验的启发。因此，知识增长过程应在时间维度上显示出强烈的关联性。在我们的研究中，我们发现，在网络训练过程中，特征图的演变遵循时间序列特性。适当的时序监督可能进一步提高网络训练性能。受此观察的启发，我们提出了时序监督知识蒸馏（TSKD）。具体而言，我们通过卷积长短期记忆网络（Conv-LSTM）在学生网络的不同训练阶段提取时空特征。然后，我们通过一个动态目标而非静态的教师网络特征来训练学生网络。这一过程实现了学生网络中老知识的细化，并利用这些知识来辅助当前的学习。广泛的实验验证了与现有知识蒸馏方法相比，我们方法的有效性和优点，包括各种网络架构和不同的任务（图像分类和目标检测）。

发布时间: 5/13/2025

查看原文

通过大型语言模型进行点击诱饵检测

作者: Han Wang, Yi Zhu, Ye Wang, Yun Li, Yunhao Yuan, Jipeng Qiang

arXiv:2306.09597v4 宣告类型: replace-cross 摘要: 点击诱饵旨在通过提供一些令人惊讶甚至刺激的标题来诱导用户点击，以提高点击率，渗透几乎所有在线内容发布者，如新闻门户和社交媒体平台。最近，大型语言模型（LLMs）作为强大的工具已取得巨大成功，并在一系列NLP下游任务中取得了显著成果。然而，尚未确定LLMs是否可以用作高质量的点击诱饵检测系统。在本文中，我们在几个英文和中文基准数据集上分析了LLMs在少样本和零样本场景下的性能。实验结果显示，LLMs在性能上无法与最先进的深度微调PLMs方法相比。与人类直觉不同，实验表明，仅凭标题，LLMs无法实现满意的点击诱饵检测效果。

发布时间: 5/13/2025

查看原文

图上的去中心化对抗训练

作者: Ying Cao, Elsa Rizk, Stefan Vlaski, Ali H. Sayed

arXiv:2303.13326v3 通告类型: 更改-交叉引用摘要：机器学习模型对对抗攻击的脆弱性近年来引起了广泛关注。大多数现有研究主要关注独立单代理学习者的行为。相比之下，本文研究了图上的对抗训练，其中个体代理受到不同强度水平的空间扰动。预期通过链接代理间的交互以及在图上可能存在的异质性攻击模型，可以借助群体协调能力增强鲁棒性。利用分布式学习的最小-最大形式，我们为多代理系统开发了一种去中心化的对抗训练框架。具体地，我们基于两种流行的去中心化学习策略——扩散和共识，设计了两种去中心化的对抗训练算法。我们分析了所提出框架在强凸、凸和非凸环境下的收敛性，并说明了对抗攻击下的增强鲁棒性。

发布时间: 5/13/2025

查看原文

guilt 的进化优势：在结构化群体中社交愧疚与非社交愧疚的共进化

作者: Theodor Cimpeanu, Luis Moniz Pereira, The Anh Han

arXiv:2302.09859v2 公告类型：替换交叉摘要：构建道德机器可能涉及赋予它们自我评估和对自身行为悔过的感情能力。尽管道歉代表潜在的战略互动，但明确地将悔过作为行为特征的发展仍然不甚了解。我们的研究探讨了两种形式的情感悔过的共进化：社会悔过涉及成本，需要代理付出努力去理解他人的内心状态和行为；而非社会悔过只涉及对自己状态的认识，不涉及社交成本。借助进化博弈理论的方法，我们从分析、广泛的数值模拟和基于代理的模拟中探讨了悔过是否以及如何进化和部署，这取决于代理系统的基本结构。我们的发现表明，在方形网格和无标度网络中，偏好情感悔过策略在更广泛的悔过和社交成本范围内占主导地位，从而导致更高的合作水平。在结构化的群体中，通过与情感倾向策略的聚类，社会悔过和非社会悔过都能繁盛，从而为防止剥削者提供保护，尤其是对于成本较低的非社会悔过策略。这些见解阐明了悔过与合作之间的复杂交互，增强了我们对道德人工智能的理解。

发布时间: 5/13/2025

查看原文

泵调度问题：强化学习的现实场景

作者: Henrique Don\^ancio, Laurent Vercouter, Harald Roclawski

arXiv:2210.11111v2 Announce Type: replace-cross 摘要：深度强化学习（DRL）已经在如游戏和机器人这样的任务定义明确的领域展现了令人印象深刻的成果。然而，很少有DRL基准测试基于复杂的真实世界环境，在这些环境中，安全约束、部分可观测性以及需要手工工程化任务表示形式带来了显著挑战。为了帮助弥合这一差距，我们引入了一个基于真实水分配设施中泵调度问题的测试平台。该任务涉及控制泵以确保可靠的供水，同时最小化能源消耗并遵守系统的约束条件。我们的测试平台包括一个真实的模拟器、三年的高分辨率（1分钟）的人工控制操作数据以及一个基线的RL任务形式化。该测试平台支持广泛的研究所涵盖的领域，包括离线RL、安全探索、逆RL以及多目标优化。

发布时间: 5/13/2025

查看原文

音频变换器

作者: Prateek Verma, Jonathan Berger

arXiv:2105.00335v2 通知类型: 替换-交叉摘要：在过去的二十年中，CNN架构产生了令人信服的声音感知和认知模型，学习了特征的分层组织。类似于计算机视觉领域的成功，音频特征分类可以根据不同的任务在广泛的数据库和标签上进行优化。实际上，为图像理解设计的类似架构已被证明对声学场景分析有效。在这里，我们提出将基于Transformer的架构应用于原始音频信号，而无需使用卷积层。在包含200个类别的标准Free Sound 50K数据集上，我们的模型在卷积模型之上产生了最先进的结果。这具有重要意义，因为与自然语言处理和计算机视觉领域不同，我们没有进行无监督的预训练以超越卷积架构。在同一训练集上，就平均平均精度基准而言，我们展示了显著的改进。我们进一步通过使用过去几年设计的卷积网络启发的池化技术改进了Transformer架构的性能。此外，我们还展示了如何将启发自小波的多速率信号处理思想应用于Transformer嵌入，以提高结果。我们还展示了我们的模型如何学习一个非线性且非恒定带宽的滤波银行，这为音频理解任务提供了一种可适应的时间频率前端表示，不同于其他任务，例如音调估计。

发布时间: 5/13/2025

查看原文