arXiv 论文列表

PalmBench：移动平台上压缩大型语言模型的综合基准测试

作者: Yilong Li, Jingyu Liu, Hao Zhang, M Badri Narayanan, Utkarsh Sharma, Shuai Zhang, Pan Hu, Yijing Zeng, Jayaram Raghuram, Suman Banerjee

将大型语言模型 (LLM) 部署到移动设备上，对于那些出于隐私问题不愿将数据传输到远程云服务器，或因网络连接不畅而无法传输数据的场景来说，具有优势。最近的进展（MLC，2023a；Gerganov，2023）促进了 LLM 的本地部署。然而，本地部署也带来了挑战，特别是在平衡移动设备硬件约束下的质量（生成性能）、延迟和吞吐量方面。在本文中，我们介绍了我们轻量级、一体化的自动基准测试框架，该框架允许用户在移动设备上评估 LLM。我们对各种流行的 LLM 进行了全面的基准测试，这些 LLM 具有不同的量化配置（权重和激活），涵盖了具有不同硬件能力的多个移动平台。与在高端 GPU 集群上评估完整规模模型的传统基准测试不同，我们专注于评估移动设备上压缩模型的资源效率（内存和功耗）以及有害输出。我们的主要观察结果包括：i) 不同移动平台之间的能效和吞吐量差异；ii) 量化对内存使用量、GPU 执行时间和功耗的影响；iii) 量化模型与未量化模型相比，其准确性和性能下降；以及 iv) 压缩 LLM 在移动设备上生成的幻觉和有害内容的频率。

发布时间: 10/10/2024

查看原文

基于联邦学习的智能原生网络切片安全架构

作者: Rodrigo Moreira, Rodolfo S. Villaca, Moises R. N. Ribeiro, Joberto S. B. Martins, Joao Henrique Correa, Tereza C. Carvalho, Flavio de Oliveira Silva

网络切片 (NS) 改变了网络中资源共享的格局，为支持下一代 5G/6G 移动网络 (NGMN)、车联网、工业物联网 (IoT) 和垂直行业等领域中具有高度可变需求的服务和应用程序提供了灵活性。尽管大量的研究和实验推动了网络切片的开发，但现有的架构在固有的架构智能安全能力方面往往存在不足。本文提出了一种架构智能安全机制来改进 NS 解决方案。我们理想化了一种安全原生架构，该架构将智能微服务作为基于机器学习的联邦代理部署，为 Slicing Future Internet Infrastructures (SFI2) 参考架构提供切片内和架构操作安全。值得注意的是，联邦学习方法与高度分布式的现代基于微服务的架构相匹配，因此为 NS 平台提供了一种统一且可扩展的设计选择，以解决服务和安全问题。使用 ML 代理和安全代理，我们的方法使用通用且非侵入式遥测记录识别了切片内的分布式拒绝服务 (DDoS) 和入侵攻击，在网络切片架构中实现了约 95.60% 的平均准确率，在部署的切片内实现了 99.99% 的准确率。该结果证明了利用架构操作安全性的潜力，并为网络切片架构开辟了一个有希望的新研究方向。

发布时间: 10/10/2024

查看原文

ConceptLens：从像素到理解

作者: Abhilekha Dalal, Pascal Hitzler

ConceptLens 是一种创新工具，通过可视化隐藏的神经元激活来阐明深度神经网络 (DNN) 的复杂运作机制。通过将深度学习与符号方法相结合，ConceptLens 为用户提供了一种独特的方式来理解是什么触发了神经元激活以及它们如何响应各种刺激。该工具使用误差范围分析来提供对神经元激活置信度的洞察，从而提高了 DNN 的可解释性。本文概述了 ConceptLens，其实现，以及它在通过条形图实时可视化神经元激活和误差范围方面的应用。

发布时间: 10/10/2024

查看原文

基于可解释人工智能增强 6G 网络物联网安全的方案

作者: Navneet Kaur, Lav Gupta

无线通信已经取得了重大发展，6G 为物联网带来了突破性的能力。然而，将物联网集成到 6G 中也带来了新的安全挑战，由于开放式无线接入网 (open RAN)、太赫兹 (THz) 通信、智能反射面 (IRS)、大规模 MIMO 和人工智能等先进技术的引入，攻击面不断扩大。人工智能利用、虚拟化风险以及数据操纵和信号干扰等不断演变的攻击等新兴威胁进一步加剧了安全工作。随着 6G 标准将于 2030 年最终确定，安全措施与技术进步的协调工作仍在继续。然而，旨在保护集成物联网和 6G 系统的框架中仍然存在重大差距。我们的研究利用基于树的机器学习算法来管理复杂的数据集并评估特征重要性，从而解决了这些挑战。我们应用数据平衡技术以确保攻击的公平表示，并使用 SHAP 和 LIME 来提高模型透明度。通过将特征重要性与 XAI 方法对齐并进行交叉验证以确保一致性，我们提高了模型精度并增强了 6G 生态系统中的物联网安全。

发布时间: 10/10/2024

查看原文

面向确保欧盟人工智能法案合规性和大型语言模型的对抗鲁棒性

作者: Tomas Bueno Momcilovic, Beat Buesser, Giulio Zizzo, Mark Purcell, Dian Balta

大型语言模型容易被滥用且容易受到安全威胁，引发了重大的安全和安全问题。欧盟的人工智能法案试图在某些情况下强制执行人工智能的鲁棒性，但由于缺乏标准、大型语言模型的复杂性和新兴的安全漏洞，其实施面临挑战。我们的研究引入了一个框架，使用本体论、保证案例和事实清单来帮助工程师和利益相关者理解和记录人工智能系统在对抗鲁棒性方面的合规性和安全性。这种方法旨在确保大型语言模型符合监管标准，并能够抵御潜在威胁。

发布时间: 10/10/2024

查看原文

输出侦察：大型语言模型灾难性响应的审计

作者: Andrew Bell, Joao Fonseca

近年来，大型语言模型 (LLM) 在许多自然语言处理任务中取代了传统方法。然而，在命名实体识别 (NER) 中，现有的基于 LLM 的方法...

发布时间: 10/10/2024

查看原文

面向对抗鲁棒性和监管合规的大语言模型 (LLM) 保证案例开发

作者: Tomas Bueno Momcilovic, Dian Balta, Beat Buesser, Giulio Zizzo, Mark Purcell

本文提出了一种为大型语言模型 (LLM) 的对抗鲁棒性和监管合规性开发保证案例的方法。我们专注于自然语言和代码语言任务，探讨了这些模型面临的漏洞，包括基于越狱、启发式算法和随机化的对抗性攻击。我们提出了一个分层框架，在 LLM 部署的不同阶段加入护栏，旨在减轻这些攻击并确保遵守欧盟人工智能法案。我们的方法包括一个用于动态风险管理和推理的元层，这对于解决 LLM 漏洞的不断变化的本质至关重要。我们用两个示例保证案例说明了我们的方法，突出了不同的上下文如何需要量身定制的策略来确保鲁棒且合规的人工智能系统。

发布时间: 10/10/2024

查看原文

基于扩散的无监督视听语音增强

作者: Jean-Eudes Ayilo (MULTISPEECH), Mostafa Sadeghi (MULTISPEECH), Romain Serizel (MULTISPEECH), Xavier Alameda-Pineda (ROBOTLEARN)

本文提出了一种新的无监督视听语音增强 (AVSE) 方法，该方法将基于扩散的视听语音生成模型与非负矩阵分解 (NMF) 噪声模型相结合。首先，扩散模型在对应视频数据条件下对干净语音进行预训练，以模拟语音生成分布。然后，将该预训练模型与基于 NMF 的噪声模型配对，以迭代估计干净语音。具体而言，在反向扩散过程中实施了一种基于扩散的后验采样方法，其中在每次迭代后，都会获得语音估计并用于更新噪声参数。实验结果证实，所提出的 AVSE 方法不仅优于其音频专用方法，而且比最近的监督生成 AVSE 方法具有更好的泛化能力。此外，与之前的基于扩散的方法相比，新的推理算法在推理速度和性能之间取得了更好的平衡。

发布时间: 10/10/2024

查看原文

大型语言模型如何理解图模式？一个图模式理解基准测试

作者: Xinnan Dai, Haohao Qu, Yifen Shen, Bohang Zhang, Qihao Wen, Wenqi Fan, Dongsheng Li, Jiliang Tang, Caihua Shan

大型语言模型 (LLM) 在许多自然语言处理任务中已取代了传统方法。然而，在命名实体识别 (NER) 中，现有的基于 LLM 的方法...

发布时间: 10/10/2024

查看原文

AutoDAN-Turbo：一个用于策略自我探索以突破大型语言模型限制的终身代理

作者: Xiaogeng Liu, Peiran Li, Edward Suh, Yevgeniy Vorobeychik, Zhuoqing Mao, Somesh Jha, Patrick McDaniel, Huan Sun, Bo Li, Chaowei Xiao

本文提出了 AutoDAN-Turbo，一种黑盒越狱方法，它能够从头开始自动发现尽可能多的越狱策略，无需任何人工干预或预定义范围（例如，指定候选策略），并将其用于红队攻击。结果表明，AutoDAN-Turbo 能够显著优于基线方法，在公开基准测试中平均攻击成功率提高了 74.3%。值得注意的是，AutoDAN-Turbo 在 GPT-4-1106-turbo 上实现了 88.5% 的攻击成功率。此外，AutoDAN-Turbo 是一个统一的框架，可以以即插即用方式整合现有的由人工设计的越狱策略。通过整合人工设计的策略，AutoDAN-Turbo 甚至可以在 GPT-4-1106-turbo 上实现更高的攻击成功率，达到 93.4%。

发布时间: 10/10/2024

查看原文