arXiv 论文列表

未来交互式语音应答的安全保障：以敏捷安全、数据合规和伦理AI集成为主导的AI驱动创新

作者: Khushbu Mehboob Shaikh, Georgios Giannakopoulos

arXiv:2505.01514v1 交互类型: 跨学科摘要：通信系统的快速数字化使 Interactive Voice Response (IVR) 技术成为客户互动的关键界面。随着人工智能 (AI) 现在驱动这些平台，确保安全、合规且具有伦理的设计和开发实践比以往更为重要。由人工智能驱动的 IVRs 利用自然语言处理 (NLP) 和机器学习 (ML) 个性化互动，自动化服务交付并优化用户体验。然而，这些创新使系统面临更高的风险，包括数据隐私泄露、AI 决策不透明以及模型安全漏洞。本文分析了 IVRs 从静态代码设计到适应性强的人工智能驱动系统的演变，提出了以网络安全为中心的观点。我们提出了一种实用的治理框架，该框架嵌入敏捷安全原则、全球数据法规合规性和以用户为中心的伦理。强调设计中的隐私、适应性的风险管理以及透明度，本文认为伦理的人工智能集成不仅仅是一种功能，而是战略性的迫切需求。通过这一多维度的视角，我们强调了现代 IVRs 如何从沟通工具转变为智能、安全和问责的数字前沿，能够抵御新兴威胁并与社会期待相一致。

发布时间: 5/6/2025

查看原文

CostFilter-AD: 通过匹配成本过滤增强异常检测

作者: Zhe Zhang, Mingxiu Cai, Hanxiao Wang, Gaochang Wu, Tianyou Chai, Xiatian Zhu

arXiv:2505.01476v1 类型: cross 摘要: 无监督异常检测（UAD）旨在根据正常样本定位输入图像的异常掩码。无论是通过重建正常对应样本（基于重构的方法）还是通过学习图像特征嵌入空间（基于嵌入的方法），现有方法本质上依赖于图像级别或特征级别的匹配来推导异常评分。通常，这样的匹配过程是不准确的但又常常被忽视，从而导致检测效果不佳。为了解决这个问题，我们引入了从经典匹配任务（如深度和流估计）借用的成本过滤概念，将其应用于UAD问题。我们称之为CostFilter-AD。具体来说，我们首先在输入和正常样本之间建立一个匹配成本体，包含两个空间维度和一个匹配维度，该维度编码潜在匹配。为了细化这一点，我们提出了一种成本体过滤网络，这种网络由输入观察作为跨多个特征层的注意力查询来引导，从而有效地抑制匹配噪声，同时保留边缘结构并捕捉细微的异常。作为通用后处理插件设计，CostFilter-AD 可以与基于重构的方法或基于嵌入的方法集成。在MVTec-AD和VisA基准上的广泛实验验证了CostFilter-AD在单类和多类UAD任务中的通用优势。代码和模型将在https://github.com/ZHE-SAPI/CostFilter-AD公开发布。

发布时间: 5/6/2025

查看原文

BiGSCoder: 状态空间模型icode理解

作者: Shweta Verma, Abhinav Anand, Mira Mezini

arXiv:2505.01475v1 宣告类型: cross 摘要: 我们提出了一种新颖的编码器-only 双向状态空间模型（SSM），该模型具有门控架构，并使用掩码语言建模在代码数据集上进行了预训练，以理解代码。我们的工作旨在系统地评估 SSM 在编码任务方面的能力，而与传统变压器架构相比；BiGSCoder 就是为此目的建立的。通过在各种不同的预训练配置和代码理解基准测试中进行全面的实验，我们证明了尽管 BiGSCoder 使用了更简单的预训练策略和更少的训练数据，它在各种编码任务上的表现仍然优于基于变压器的模型。我们的结果显示，BiGSCoder 可以作为一种更有效的替代常规变压器模型的选择。此外，我们的研究表明，SSM 在没有位置嵌入的情况下表现更好，并且在微调过程中能够有效扩展到更长的序列。

发布时间: 5/6/2025

查看原文

StegaStamp 算法中的水印覆盖攻击

作者: I. F. Serzhenko, L. A. Khaertdinova, M. A. Pautov, A. V. Antsiferova

arXiv:2505.01474v1 宣告类型: 交叉摘要：本文介绍了一种针对StegaStamp 水印算法的攻击方法，该方法能够在保持最小质量损失的情况下完全去除图像中的水印，此方法是在 NeurIPS "抹去无形之物" 竞赛中开发的。

发布时间: 5/6/2025

查看原文

MoxE：带有熵意识路由的混合xLSTM专家语言模型高效训练方法

作者: Abdoul Majid O. Thiombiano, Brahim Hnich, Ali Ben Mrad, Mohamed Wiem Mkaouer

arXiv:2505.01459v1 交叉公告类型摘要：本文介绍了一种新颖的架构MoxE，该架构将扩展长短期记忆（xLSTM）与专家混合（MoE）框架协同结合，以解决大型语言模型（LLMs）中关键的可扩展性和效率挑战。所提出的方法有效利用了xLSTM创新的记忆结构，同时通过MoE战略性地引入稀疏性，显著减少了计算开销。我们方法的核心是一个新颖的基于熵的路由机制，旨在动态地将令牌路由到专门的专家手中，以确保有效和均衡的资源利用。这种熵意识使架构能够有效地管理罕见和常见的令牌，其中mLSTM块更倾向于处理罕见的令牌。为了进一步增强泛化能力，我们引入了一套辅助损失，包括基于熵和组内平衡损失，确保稳健的性能和高效的训练。理论分析和实证评估严格证明，MoxE相比现有方法实现了显著的效率提升和增强的效果，标志着可扩展LLM架构的一个显著进步。

发布时间: 5/6/2025

查看原文

embodied AI时代基于物理模拟的机器人导航与操作综述

作者: Lik Hang Kenny Wong, Xueyang Kang, Kaixin Bai, Jianwei Zhang

arXiv:2505.01458v1 类型: cross 摘要：导航和操纵是体域人工智能的核心能力，但在现实世界中训练具备这些能力的代理面临高昂的成本和复杂的时间要求。因此，模拟到现实的转移成为了一个关键方法，但模拟到现实的差距依然存在。本文综述了如何通过分析之前综述中忽略的物理模拟器的特性来解决这一差距。我们还分析了这些模拟器在导航和操纵任务中的特性，以及硬件需求。此外，我们提供了一个资源，其中包括基准数据集、评估指标、模拟平台以及最新的方法（如世界模型和几何不变性），以帮助研究人员在考虑硬件限制的情况下选择合适的工具。

发布时间: 5/6/2025

查看原文

多模态LLM中敏感信息的卸载：基准与攻防评估

作者: Vaidehi Patil, Yi-Lin Sung, Peter Hase, Jie Peng, Tianlong Chen, Mohit Bansal

arXiv:2505.01456v1 类型: cross 摘要: 在大规模数据集上训练的LLMs可能会无意中获取敏感信息，如个人资料和潜在有害内容。在多模态LLMs中，由于它们整合了多种模态（图像和文本）的信息，这种风险进一步增加。对手可以通过多模态提示利用这些知识提取敏感细节。评估多模态LLMs如何有效地忘记此类信息（目标卸载）需要创建高质量且注释良好的图像-文本对。尽管之前关于卸载的工作主要集中在文本上，但多模态卸载仍然很少被探索。为解决这一缺口，我们首先引入了一个多模态卸载基准，即UnLOK-VQA（超越知识VQA），以及一个攻击-防御框架来评估从多模态LLMs中删除特定知识的方法。我们使用自动化管道扩展了一个视觉问答数据集，生成了不同接近度的样本进行测试，随后进行了人工筛选以保持高质量。然后，我们对六项防御目标进行了七次攻击（四种白盒攻击，三种黑盒攻击）的评估，包括一个利用隐藏状态可解释性的新型白盒方法。结果表明，多模态攻击优于仅针对文本或图像的攻击，并且最有效的防御措施是从内部模型状态中删除答案信息。此外，更大的模型在编辑后表现出更强的鲁棒性，这表明规模可以增强安全性。UnLOK-VQA 为多模态LLMs 中的卸载研究提供了严格的基准。

发布时间: 5/6/2025

查看原文

使用分散式安全屏障实现安全高效的CAV换道

作者: Bharathkumar Hegde, Melanie Bouroche

arXiv:2505.01453v1 宣告类型：交叉摘要：车道变换对连接和自动驾驶车辆（CAVs）来说是一个复杂的决策问题，因为它需要在交通效率和安全性之间取得平衡。虽然可以通过使用车与车之间的通信来利用多代理强化学习（MARL）进行车道变换控制器的训练，从而提升交通效率，但要确保安全性却是一项挑战。为了解决这一问题，我们提出了一个去中心化的混合安全性盾牌（HSS），它结合了优化和基于规则的方法来保证安全性。我们的方法应用控制屏障函数来约束CAVs的纵向和横向控制输入，从而确保安全的操作。此外，我们提出了一个架构将HSS与MARL集成，称为MARL-HSS，以提高交通效率同时确保安全性。我们使用类似于 gym 的环境来评估 MARL-HSS，该环境模拟了一个匝道合并场景，交通密度分为轻度和中度两种。结果表明，HSS 通过严格强制执行基于时间间隔的动态安全性约束，提供了安全性保证，即使在提供具有挑战性的车道变换场景的中度交通密度下也不例外。此外，与没有安全性盾牌的最先进的MARL车道变换控制器基线相比，所提出的方法可以学习到更稳定的策略。进一步的策略评估表明，在轻度和中度交通密度下，我们的方法能够在零事故的情况下实现安全性和交通效率的平衡，并且平均车速相当。

发布时间: 5/6/2025

查看原文

可解释的人工智能在注射成型产品质量根本原因分析中的正确诊断

作者: Muhammad Muaz, Sameed Sajid, Tobias Schulze, Chang Liu, Nils Klasen, Benny Drescher

arXiv:2505.01445v1 宣告类型: cross 摘要: 如果在注塑成型过程中产品偏离其期望属性，模型可以帮助进行根本原因分析，这些模型将机器输入设置与输出质量特性联系起来。用于质量预测的机器学习模型大多是黑箱模型；因此，它们的预测没有直接解释，这限制了它们在质量控制中的应用。此前尝试的可解释性方法要么仅限于树基算法，要么没有强调一些可解释性方法可能会导致错误的产品偏离期望属性的根本原因识别。本研究首先展示了在根据中心复合设计收集的实际实验数据中，多个输入机器设置之间的相互作用确实存在。然后，首次比较了模型无偏的可解释人工智能方法，以表明不同的可解释性方法确实会导致不同的注塑成型特征影响分析。此外，展示了更好的特征归因能够转化为正确的原因识别和对注塑成型过程的可操作洞察。由于两个模型（随机森林和多层感知机）在实验数据集上的平均绝对百分比误差均低于0.05%，因此对这两种模型进行了原因分析的解释。

发布时间: 5/6/2025

查看原文

交互式双深度Q网络：在自主驾驶 reinforcement 学习中集成人类干预和评价预测

作者: Alkis Sygkounas, Ioannis Athanasiadis, Andreas Persson, Michael Felsberg, Amy Loutfi

arXiv:2505.01440v1 类别: cross 摘要: 将人类专业知识与机器学习相结合对于要求高准确性和安全性的应用至关重要，例如自动驾驶。本研究介绍了交互式双深度Q网络（iDDQN），这是一种人机在环（Human-in-the-Loop, HITL）方法，通过直接将人类见解合并到强化学习（Reinforcement Learning, RL）训练过程中，来提升模型性能。我们提出的方法 iDDQN 修改了Q值更新方程，以整合人类和代理人的动作，建立了一种政策开发的协作方法。此外，我们还提出了一种离线评估框架，该框架模拟了代理人在没有人类干预的情况下的轨迹，以评估人类干预的有效性。在模拟的自动驾驶场景中的实证结果表明，iDDQN 在利用人类专业知识提升性能和适应性方面优于包括行为克隆（BC）、HG-DAgger、深度Q学习从示范（DQfD）以及纯因子RL在内的现有方法。

发布时间: 5/6/2025

查看原文