arXiv 论文列表

作者: Paxson Swierc, Marcos Tamargo-Arizmendi, Aleksandra \'Ciprijanovi\'c, Brian D. Nord

强引力透镜建模对于现代和下一代宇宙巡天数据来说成本高昂。神经后验估计 (NPE) 是一种基于模拟的推理 (SBI) 方法，已被研究作为一种高效分析强透镜数据的途径。然而，NPE 尚未被证明能够很好地处理域外目标数据——例如，在模拟数据上进行训练然后应用于真实观测数据时。在这项工作中，我们首次研究了 NPE 与无监督域适应 (UDA) 相结合的有效性。源域是无噪声的，目标域具有模拟现代宇宙学巡天的噪声。我们发现，结合 UDA 和 NPE 可以将推理精度提高 1-2 个数量级，并显著提高与不使用 UDA 的 NPE 模型相比的后验覆盖率。我们预计，这种方法的结合将有助于未来将 NPE 模型应用于真实的观测数据。

发布时间: 10/23/2024

查看原文

量子卷积神经网络：一种用于虹膜数据集分类的混合量子经典方法

作者: S. M. Yousuf Iqbal Tomal, Abdullah Al Shafin, Afrida Afaf, Debojit Bhattacharjee

本文提出了一种用于分类任务的混合量子经典机器学习模型，该模型将一个4量子比特的量子电路与一个经典神经网络相集成。量子电路旨在使用角度嵌入和纠缠门对鸢尾花数据集的特征进行编码，从而捕捉经典模型单独难以捕捉的复杂特征关系。该模型，我们称之为量子卷积神经网络（QCNN），经过20个epoch的训练，在第16个epoch时在鸢尾花数据集测试集上取得了完美的100%准确率。我们的结果证明了量子增强模型在监督学习任务中的潜力，尤其是在使用量子资源有效编码和处理数据方面。我们详细介绍了量子电路设计、参数化门选择以及量子层与经典神经网络组件的集成。这项工作为混合量子经典模型及其在现实世界数据集中的应用研究做出了贡献。

发布时间: 10/23/2024

查看原文

虚晃一枪再进攻：基于注意力机制的 LLM 越狱与防护策略

作者: Rui Pu, Chaozhuo Li, Rui Ha, Zejian Chen, Litian Zhang, Zheng Liu, Lirong Qiu, Xi Zhang

越狱攻击可通过诱导大型语言模型 (LLM) 生成有害内容来利用其漏洞。最常见的攻击方法是构造语义模糊的提示来混淆和误导 LLM。为了评估安全性并揭示 LLM 的输入提示和输出之间的内在关系，本文引入了注意力权重分布来分析其根本原因。通过使用统计分析方法，定义了一些新的指标来更好地描述注意力权重分布，例如敏感词的注意力强度 (Attn_SensWords)、基于注意力的上下文依赖性得分 (Attn_DepScore) 和注意力分散熵 (Attn_Entropy)。利用这些指标的不同特征，并受军事策略“虚张声势”的启发，提出了一种名为基于注意力的攻击 (ABA) 的有效越狱攻击策略。在 ABA 中，采用嵌套攻击提示来转移 LLM 的注意力分布。通过这种方式，输入中更多无害的部分可以用来吸引 LLM 的注意力。此外，受 ABA 的启发，还提出了一种名为基于注意力的防御 (ABD) 的有效防御策略。与 ABA 相比，ABD 可用于通过校准输入提示的注意力分布来增强 LLM 的鲁棒性。一些对比实验已经证明了 ABA 和 ABD 的有效性。因此，ABA 和 ABD 都可以用来评估 LLM 的安全性。对比实验结果也从逻辑上解释了注意力权重分布会对 LLM 的输出产生巨大影响。

发布时间: 10/23/2024

查看原文

CybORG++：一个增强型自主网络代理开发环境

作者: Harry Emerson, Liz Bates, Chris Hicks, Vasilios Mavroudis

CybORG++是一个专注于网络防御的强化学习研究高级工具包。它以CAGE 2 CybORG环境为基础，引入了关键改进，包括增强的调试功能、改进的智能体实现支持以及简化的环境，从而实现更快的训练和更轻松的定制。除了修复其前身中的几个软件错误之外，CybORG++还引入了MiniCAGE，这是一个轻量级的CAGE 2版本，它极大地提高了性能，在并行迭代中的执行速度提高了高达1000倍，而不会牺牲精度或核心功能。CybORG++作为一个强大的平台，用于开发和评估防御智能体，使其成为推进企业网络防御研究的宝贵资源。

发布时间: 10/23/2024

查看原文

SouLLMate：基于自适应大型语言模型、提示工程和检索增强生成技术的多种心理健康支持增强应用

作者: Qiming Guo, Jinwen Tang, Wenbo Sun, Haoteng Tang, Yi Shang, Wenlu Wang

大型语言模型（LLM）已取代众多自然语言处理任务中的传统方法。然而，在命名实体识别（NER）中，现有的基于LLM的方法……

发布时间: 10/23/2024

查看原文

基于YOLOv4的实时目标检测加速

作者: K. Senthil Kumar, K. M. B. Abdullah Safwan

目标检测是计算机视觉的一个分支，它能够检测图像和视频中物体的实例。由于其在监控、安全追踪系统等众多应用中的广泛使用，推动研究人员不断开发更高效、更具竞争力的算法。然而，由于实时环境的动态性和目标检测中使用的复杂算法，在实际应用中会遇到一些问题。近年来，卷积神经网络 (CNN) 已成为识别图像内容和解决大多数计算机视觉问题的强大工具。本文首先简要介绍深度学习和目标检测框架，例如卷积神经网络 (CNN) 和 You Only Look Once 版本 4 (YOLOv4)。然后，我们重点介绍我们提出的目标检测架构及其一些改进之处。传统模型在检测图像中的小物体方面存在不足，我们对模型进行了一些改进。我们的方法能够以更高的精度给出正确的检测结果。

发布时间: 10/23/2024

查看原文

人脸识别系统物理对抗攻击综述

作者: Mingsi Wang, Jiachen Zhou, Tianlin Li, Guozhu Meng, Kai Chen

随着人脸识别 (FR) 技术在金融、军事、公共安全和日常生活中的应用日益广泛，安全问题也日益突出。针对真实世界环境中人脸识别系统的物理对抗攻击因其实用性和造成的严重威胁而吸引了大量的研究兴趣。然而，目前仍然缺乏对针对人脸识别系统的物理对抗攻击的系统性综述，这阻碍了对该领域挑战和未来方向的深入探索。本文弥合了这一差距，通过全面收集和分析针对人脸识别系统的物理对抗攻击方法。具体来说，我们首先研究了人脸识别系统物理攻击的关键挑战。然后，我们根据所使用的物理介质将现有的物理攻击分为三类，并总结了每一类研究如何发展以应对这些挑战。此外，我们回顾了当前的防御策略，并讨论了未来的潜在研究方向。我们的目标是提供对针对人脸识别系统的物理对抗攻击的新颖、全面和深入的理解，从而激发该领域的相关研究。

发布时间: 10/23/2024

查看原文

基于大型语言模型的启发式算法自动化设计中的闭环超参数优化

作者: Niki van Stein, Diederick Vermetten, Thomas B\"ack

大型语言模型 (LLM) 在自动生成和优化（元）启发式算法方面展现出巨大的潜力，使其成为启发式优化任务中的宝贵工具。然而，LLM 在微调生成的算法的超参数方面通常效率低下，往往需要过多的查询，从而导致高昂的计算和财务成本。本文提出了一种新颖的混合方法 LLaMEA-HPO，它将开源的 LLaMEA（大型语言模型进化算法）框架与循环中的超参数优化 (HPO) 程序集成在一起。通过将超参数调整卸载到 HPO 程序，LLaMEA-HPO 框架允许 LLM 专注于生成新颖的算法结构，减少所需的 LLM 查询次数，并提高优化过程的整体效率。我们通过在线装箱问题、黑盒优化和旅行商问题等基准问题对提出的混合框架进行了实证验证。我们的结果表明，LLaMEA-HPO 在显著降低计算成本的同时，实现了与现有 LLM 驱动框架相比更好或相当的性能。这项工作突出了在 LLM 驱动的代码优化中将算法创新和结构代码搜索与参数调整分离的重要性，并提供了一种可扩展的方法来提高基于 LLM 的代码生成的效率和有效性。

发布时间: 10/23/2024

查看原文

大型语言模型时代政治学中的智能计算社会建模与方法论创新

作者: Zhenyu Wang, Yi Xu, Dequan Wang, Lingfeng Zhou, Yiqi Zhou

大型语言模型 (LLM) 的兴起为政治学方法论创新带来了机遇和挑战，引发了关于社会科学潜在范式转变的讨论。然而，如何从整合技术和方法论的综合视角来理解 LLM 对社会科学知识生产和范式转变的影响？LLM 在政治学研究中的具体应用和具有代表性的创新方法是什么？这些问题，特别是从实用的方法论角度来看，仍未得到充分探索。本文提出了“智能计算社会建模”(ICSM) 方法来解决这些问题，方法是阐明LLM的关键机制。ICSM 利用LLM在思想综合和行动模拟方面的优势，通过“模拟社会建构”和“模拟验证”来推进政治学领域的智力探索。通过模拟美国总统选举，本研究实证地论证了ICSM的操作路径和方法论优势。通过整合传统的社会科学范式，ICSM 不仅增强了定量范式应用大数据评估因素影响的能力，也为定性范式提供了个人层面社会机制发现的证据，提供了一种在社会科学研究中平衡可解释性和可预测性的强大工具。研究结果表明，LLM 将通过整合和改进而非直接替代来推动政治学方法论的创新。

发布时间: 10/23/2024

查看原文

鹰：一种用于精确低功耗设备识别的高效NALM系统

作者: Zijian Wang, Xingzhou Zhang, Yifan Wang, Xiaohui Peng, Zhiwei Xu

非侵入式电器负荷监测 (NALM) 旨在无需室内传感器即可从主电表识别单个电器的使用情况。然而，现有系统难以平衡数据集构建效率和事件/状态识别精度，尤其是在低功耗电器识别方面。本文介绍了 Hawk，这是一个高效且准确的 NALM 系统，它分两个阶段运行：数据集构建和事件识别。在数据构建阶段，我们基于平衡格雷码高效地收集了一个平衡且多样化的数据集 HawkDATA，并通过一种名为共享感知时间的采样同步策略实现自动数据标注。在事件识别阶段，我们的算法集成了稳态差分预处理和基于投票的后处理，以从总电流中准确识别事件。实验结果表明，HawkDATA 的收集时间仅为基线的 1/71.5，但收集的电器状态组合数量是基线的 6.34 倍。在 HawkDATA 和一个广泛使用的数据集中，Hawk 在状态识别方面的平均 F1 分数达到 93.94%，在事件识别方面的平均 F1 分数达到 97.07%，分别比最先进的算法提高了 47.98% 和 11.57%。此外，选定的电器子集和从 HawkDATA 训练的模型已部署在两个具有许多未知背景电器的真实场景中。事件识别的平均 F1 分数分别为 96.02% 和 94.76%。Hawk 的源代码和 HawkDATA 可在 https://github.com/WZiJ/SenSys24-Hawk 获取。

发布时间: 10/23/2024

查看原文