arXiv 论文列表

作者: Houssam Kherraz

arXiv:2504.13205v1 交叉公告类型：cross 摘要：随着生成式人工智能模型产出日益逼真的结果，学术界和行业都在关注如何识别某个输出是否由AI模型生成。大多数研究努力和政策讨论都集中在AI输出的鲁棒水印技术上。尽管取得了不少进展，但所有水印技术和AI检测方法都面临严重局限。在这篇立场论文中，我们主张我们采用的是一种错误的方法，应该将重点放在可信内容而非AI生成内容的加密签名水印技术上。对于音频视觉内容，尤其是所有实际内容都是基于物理世界的，并通过硬件传感器捕捉到的。这为我们提供了在硬件层进行水印的独特机会，我们提出了一个社会技术框架，并将其与HTTPS认证和蓝光验证协议进行类比。尽管我们承认实施挑战，我们认为基于硬件的认证提供了更可行的前进道路，尤其是在政策层面。随着生成模型接近感知不可区分性，研究界应警惕对AI水印过于乐观，我们主张将AI水印研究努力投入到文本和LLM空间，最终这些内容不可能通过物理传感器追溯。

发布时间: 4/21/2025

查看原文

X-Teaming：多轮脱控制以及自适应多代理防御

作者: Salman Rahman, Liwei Jiang, James Shiffer, Genglin Liu, Sheriff Issaka, Md Rizwan Parvez, Hamid Palangi, Kai-Wei Chang, Yejin Choi, Saadia Gabriel

arXiv:2504.13203v1 Announce Type: cross 摘要：多轮与语言模型（LMs）的互动带来了关键的安全风险，因为有害意图可以战略性地分布在多个交流中传播。然而，大多数先前的工作主要集中在单轮安全上，而适应性和多样性仍然是多轮红队挑战中的关键问题。为了解决这些挑战，我们提出了X-Teaming，这是一个可扩展的框架，系统地探索看似无害的互动如何升级为有害的结果，并生成相应的攻击场景。X-Teaming 使用协作型代理进行规划、攻击优化和验证，在多个代表性领先开源和闭源模型中实现了最先进的多轮脱逃成功率和多样性，成功率高达98.1%。特别地，X-Teaming 在最新版本的Claude 3.7 Sonnet模型上实现了96.2%的攻击成功率，而该模型被认为几乎对单轮攻击具有免疫力。基于X-Teaming，我们引入了XGuard-Train，这是一个开源的多轮安全训练数据集，比之前的最佳资源大20倍，包含3万个交互脱逃场景，旨在使语言模型实现稳健的多轮安全对齐。我们的工作提供了用于缓解复杂对话攻击的必要工具和见解，推进了语言模型的多轮安全性。

发布时间: 4/21/2025

查看原文

使用注意力门双解码器3D U-Net的高效脑肿瘤分割（DDUNet）

作者: Mohammad Mahdi Danesh Pajouh

arXiv:2504.13200v1 交叉公告类型: cross 摘要：癌症仍然是全球主要的死亡原因之一，而在其众多形式中，由于其侵袭性和早期诊断所面临的严峻挑战，脑肿瘤特别臭名昭著。近年来，人工智能的进步在辅助医疗专业人员进行精准肿瘤分割方面展现出了巨大的潜力，这是及时诊断和治疗计划的关键步骤。然而，许多最先进的分割方法需要大量的计算资源和长时间的训练时间，限制了它们在资源受限环境中的实际应用。在这项工作中，我们提出了一种新的双解码U-Net架构，并结合了注意力门控跳连接，专门用于从MRI扫描中对脑肿瘤进行分割。我们的方法通过在保持高效的同时实现具有竞争力的分割性能，显著减少了训练需求。在BraTS 2020数据集上评估，所提出模型在全肿瘤（WT）的Dice分数为85.06%，肿瘤核心（TC）为80.61%，增强肿瘤（ET）为71.26%，仅用50个周期就超过了多种常用U-Net变体。我们的模型证明了即使在资源受限的情况下，高质量的脑肿瘤分割也是可行的，从而为在有限硬件条件下工作的研究人员和临床医生提供了一个可行的解决方案。这一资源高效模型有可能提高对脑肿瘤的早期检测和诊断，最终改善患者的治疗结果。

发布时间: 4/21/2025

查看原文

构建可信赖的多模态AI：关于视觉-语言任务中的公平性、透明度和伦理问题的综述

作者: Mohammad Saleha, Azadeh Tabatabaeib

arXiv:2504.13199v1 交叉公告类型：交叉摘要：目标：本文审查了多模态人工智能（AI）系统的可信性，特别关注视觉语言任务。文中针对这些系统中的公平性、透明性和伦理问题提出了关键挑战，并通过对比分析视觉问答（VQA）、图像字幕和视觉对话等主要任务，提供了相关研究。背景：多模态模型，特别是视觉语言模型，通过整合视觉和文本数据来增强人工智能的能力，模拟人类学习过程。尽管取得了显著进展，但这些模型的可信性仍然是一个关键问题，特别是在人工智能系统面临公平性、透明性和伦理问题的挑战日益增多的情况下。方法：本文回顾了从2017年至2024年间关于命名的核心视觉语言任务的研究工作，并采用对比方法，在可信性视角上分析这些任务，强调公平性、可解释性和伦理问题。该研究综合了近期文献的发现，以识别趋势、挑战和最先进的解决方案。结果：突显了几个关键发现。透明性：视觉语言任务的可解释性对于提高用户信任至关重要。诸如注意力图和基于梯度的方法等技术已经成功解决了这一问题。公平性：在VQA和视觉对话系统中减少偏见是确保不同人口群体具有公平结果的关键。伦理问题：在多语言模型中解决偏见和确保负责任的数据处理对于视觉语言系统的设计至关重要。结论：本文强调了在统一框架内整合公平性、透明性和伦理考虑对于开发视觉语言模型的重要性。

发布时间: 4/21/2025

查看原文

使用最新一代无线网络中的大型语言模型调查网络安全事件

作者: Leonid Legashev, Arthur Zhigalov

arXiv:2504.13196v1 安全事件类型：跨平台摘要：研究目的：基于现代生成模型检测网络安全事件并分析决策支持，评估应对信息安全隐患措施的有效性。研究方法：在MIMO系统中模拟信号传播数据，合成对抗样本，对机器学习模型执行对抗攻击，使用大规模语言模型微调以检测对抗攻击，基于提示技术解释检测网络安全事件的决策。科学创新：使用大规模语言模型对数据投毒攻击进行了二分类，并调查了在最新一代无线网络中使用大规模语言模型进行网络安全事件调查的可能性。研究结果：在准备好的模拟无线网络段数据上对大规模语言模型进行了微调。使用准备好的数据段对六种大规模语言模型进行了对抗攻击检测比较，并研究了解释大规模语言模型决策的能力。根据精度=0.89、召回率=0.89和F1-分数=0.89的指标，Gemma-7b模型表现最佳。通过各种解释性提示，Gemma-7b模型指出了研究中的受攻击数据不一致，进行了特征重要性分析，并提供了各种减轻对抗攻击后果的建议。将大规模语言模型与网络威胁的二分类集成有显著的实用潜力，可在网络安全事件调查、决策支持及评估应对信息安全隐患措施的有效性方面得到广泛的应用。

发布时间: 4/21/2025

查看原文

通过云边协作和知识蒸馏优化多网关LoRaWAN

作者: Hong Yang

arXiv:2504.13194v1 交叉公告类型摘要：对于大规模多网关LoRaWAN网络，本文提出了一种基于边缘智能的云-边缘协作资源分配和决策方法——HEAT-LDL（HEAT-Local Distill Lyapunov），该方法实现了网关和终端节点之间的协同决策。HEAT-LDL结合了Actor-Critic架构和Lyapunov优化方法，实现了智能下行控制和网关负载均衡。当信号质量良好时，网络服务器使用HEAT算法调度终端节点。为了提高终端节点的自主决策效率，HEAT-LDL在终端节点侧对HEAT教师模型进行云-边缘知识蒸馏。当下行决策指令丢失时，终端节点使用基于先验知识和本地历史的学生模型和边缘决策器进行协同自主决策。仿真实验结果显示，与所有对比算法的最优结果相比，HEAT-LDL分别提高了20.5%的包成功率和88.1%的能量效率。

发布时间: 4/21/2025

查看原文

HEAT: 历史增强的双阶段演员-评论家算法，共享变换器

作者: Hong Yang

arXiv:2504.13193v1 宣告类型: cross 摘要: 对于单网关LoRaWAN网络，本研究提出了一种历史增强的两阶段actor-critic算法，该算法使用共享变压器算法（HEAT）以提高网络性能。HEAT 考虑了上行参数，并且有效整合了离线和在线强化学习，利用历史数据和实时交互来提高模型性能。此外，本研究开发了一个开源LoRaWAN网络仿真器LoRaWANSim。仿真器考虑了解调器锁定效应，并支持多通道、多解调器和双向通信。仿真实验表明，与所有比较算法的最佳结果相比，HEAT 分别将数据包成功率和能量效率提高了15%和95%。

发布时间: 4/21/2025

查看原文

CheatAgent：通过LLM代理攻击基于LLM的推荐系统

作者: Liang-bo Ning, Shijie Wang, Wenqi Fan, Qing Li, Xin Xu, Hao Chen, Feiran Huang

arXiv:2504.13192v1 公告类型：交叉摘要：近年来，以大型语言模型（LLM）为基础的推荐系统（RecSys）在个性化用户体验方面取得了显著的进步，并引起了广泛关注。尽管取得了令人印象深刻的进展，但有关LLM-赋能的RecSys的安全漏洞的研究问题仍然很大程度上未被充分调查。鉴于安全和隐私的担忧，更实际的方法是专注于攻击黑盒RecSys，攻击者只能观察系统的输入和输出。然而，传统的使用强化学习（RL）代理的攻击方法由于处理复杂文本输入、规划和推理能力有限，并不适用于攻击LLM-赋能的RecSys。另一方面，由于LLMs具有模拟人类决策过程令人印象深刻的能力，它们为攻击RecSys提供了前所未有的机会。因此，在本文中，我们提出了一种名为CheatAgent的新攻击框架，利用LLMs的人类能力，开发了一个基于LLM的代理攻击LLM-赋能的RecSys。具体而言，我们的方法首先识别最小输入修改下的最大影响的插入位置。然后，设计LLM代理生成对抗性扰动并将其插入目标位置。为了进一步提高生成的扰动质量，我们通过从受害者RecSys获取反馈逐次迭代改进攻击策略。在三个真实世界的数据集上进行的广泛实验表明，我们提出的方法具有有效性。

发布时间: 4/21/2025

查看原文

面向分类增强的失真压缩的通用表示

作者: Nam Nguyen

arXiv:2504.13191v1 交叉类型: cross 摘要: 在有损压缩中，压缩率与重构失真之间的传统权衡关系一直指导着算法的设计。然而，Blau和Michaeli [5] 引入了一种广义框架，称为感知质量度量的率失真感知（RDP）函数，将感知质量作为一个额外的评估维度。近年来，[19] 研究了率失真分类（RDC）函数，通过同时考虑分类准确性与失真来评估压缩性能。在这项研究中，我们探索了通用表示，即开发一个单一的编码器以在各种失真和分类（或感知）约束下实现多个解码目标。这种通用性避免了为这些权衡中的每个具体操作点重新训练编码器。我们在MNIST数据集上的实验验证表明，通用编码器在感知图像压缩任务中的性能下降仅轻微，与[23] 的先前结果相符。然而，我们还发现，在RDC设置中，再利用一个针对某一特定分类-失真权衡优化的编码器，在应用于其他点时会带来显著的失真惩罚。

发布时间: 4/21/2025

查看原文

高级深度学习和大型语言模型：全面的癌症检测 Insights

作者: Yassine Habchi, Hamza Kheddar, Yassine Himeur, Adel Belouchrani, Erchin Serpedin, Fouad Khelifi, Muhammad E. H. Chowdhury

arXiv:2504.13186v1 交叉公告类型：cross 摘要：深度学习（DL）的迅速发展已经改变了医疗保健领域，特别是在癌症检测和诊断方面。DL在准确性和人类准确性方面超越了传统的机器学习方法，使其成为识别疾病的关键工具。尽管已有许多关于DL在医疗保健领域的综述，但关于其在癌症检测中的全面分析仍然有限。现有研究集中在特定方面，留下了一些对其更广泛影响的理解空白。本文通过回顾先进的DL技术，包括迁移学习（TL）、强化学习（RL）、联邦学习（FL）、Transformer和大型语言模型（LLMs），填补了这些空白。这些方法提高了准确性，解决了数据稀缺性问题，并实现了分散式学习，同时保持数据隐私。迁移学习（TL）将预训练模型适应新的数据集，通过有限的标注数据提高性能。强化学习（RL）优化诊断路径和治疗策略，而联邦学习（FL）在不共享敏感数据的情况下促进协作模型开发。Transformer和大型语言模型原本用于自然语言处理，现在应用于医学数据以提高可解释性。此外，本文还审查了这些技术在癌症诊断中的效率，探讨了数据不平衡等挑战，并提出了解决方案。本文为研究人员和实践者提供了一项资源，提供了当前趋势的见解，并指导未来在癌症检测中高级DL的研究。

发布时间: 4/21/2025

查看原文