LLM2D

arXiv 论文列表

arXiv:2505.06380v1 Announce Type: 隐藏 摘要:随着人工智能(AI)系统在各个领域的广泛应用,对稳健的、积极主动的安全策略的需求变得至关重要。传统防御措施往往无法应对推动AI技术发展的独特且不断演变的威胁,因此,积极的安全策略成为识别和缓解风险必不可少的方法。本文提出了一种全面的AI系统积极安全框架,强调积极威胁模拟和对抗性测试,以在整个AI生命周期中发现漏洞。我们探讨了关键的积极安全技术,包括缺陷和漏洞评估、渗透测试和红队演练,这些技术是针对AI的独特脆弱性专门设计的。通过模拟实际攻击场景,这些方法论揭示出关键见解,为制定更强大的防御策略提供依据,并推动对新兴威胁的抗打击能力的提升。该框架将积极的AI安全从理论概念推进到可操作的实际方法论,这些方法论有助于组织增强其AI系统对新兴威胁的抵抗力。
发布时间: 5/13/2025
查看原文
作者: Yuxiang Wei, Zhuoqi Zeng, Yue Zhong, Jiawen Kang, Ryan Wen Liu, M. Shamim Hossain
arXiv:2505.06378v1 类型: cross 摘要: 随着大型语言模型和具身人工智能(AI)在智能交通场景中的发展,它们的结合在智能交通中催生了具身人工智能网络(VEANs)。在VEANs中,自动驾驶车辆(AVs)是典型的代理,其本地高级AI应用被定义为具身人工智能代理,从而具备环境感知和多代理协作的能力。由于计算延迟和资源约束,运行在具身人工智能代理上的本地AI应用和服务需要进行迁移,并随后被称为具身人工智能代理双胞胎,从而推动了具身人工智能网络的发展,通过将密集任务卸载到路边单元(RSUs)来缓解延迟问题,同时保持服务质量。认识到传统方法中RSUs之间的工作负载不平衡,我们将AV-RSU交互建模为Stackelberg博弈,以优化带宽资源分配,实现高效的迁移。我们设计了一种名为Tiny Multi-Agent Bidirectional LSTM Proximal Policy Optimization(TMABLPPO)的算法,通过去中心化协调来近似Stackelberg均衡。此外,我们设计了一种基于路径排除(PX)的个性化神经网络剪枝算法,能够动态适应不同的AV计算能力,通过识别训练模型中的任务关键参数来降低模型复杂性,同时减少性能下降。实验验证证实了该算法在平衡系统负载和最小化延迟方面的有效性,展示了具身人工智能代理部署的重要改进。
发布时间: 5/13/2025
查看原文
作者: Jae-Won Chung, Jiachen Liu, Jeff J. Ma, Ruofan Wu, Oh Jun Kweon, Yuxuan Xia, Zhiyu Wu, Mosharaf Chowdhury
arXiv:2505.06371v1 Announce Type: cross 摘要:随着生成式AI在现实服务中的应用爆炸式增长,能源已成为一个关键的瓶颈资源。然而,在构建机器学习系统的过程中,能源往往被忽视、探索不足或理解不足。我们提出了ML.ENERGY基准,这是一个在实际服务环境中测量推理能耗的基准套件和工具,以及相应的ML.ENERGY排行榜,这些资源对于希望理解并优化其生成式AI服务能耗的人来说至关重要。在本文中,我们解释了我们在多年中获得的四条关键设计原则,以基准测试机器学习能耗,并说明了这些原则在ML.ENERGY基准中的实现方式。然后,我们介绍了基准的最新迭代的结果,包括40种广泛使用的模型架构在6种不同任务中的能耗测量,Case Studies展示了机器学习设计选择如何影响能耗,以及自动化优化建议如何在不改变模型计算内容的情况下实现显着的(有时超过40%)能耗节省。ML.ENERGY基准是开源的,并且可以轻松扩展到各种自定义模型和应用场景。
发布时间: 5/13/2025
查看原文
作者: Anmol Gupta, Weiwei Gu, Omkar Patil, Jun Ki Lee, Nakul Gopalan
arXiv:2505.06363v1 宣告类型: cross 摘要:随着机器人越来越通用并在多种环境中部署,它们必须与复杂的物体交互,这些物体中有很多具有多个独立关节或自由度(DoF),需要精确控制。一种常见的策略是物体建模,即从实际观察中学习紧凑的状态空间模型,并与经典规划配对。然而,现有的方法往往依赖于先验知识,或者专注于单个DoF的物体,这限制了它们的应用范围。此外,它们无法处理被遮挡的关节,并且忽略了访问它们所需的操作序列。我们通过从人类示范中学习物体模型来解决这个问题。我们引入了物体运动序列机(OKSMs),这是一种新颖的表示法,可以捕捉多DoF物体的运动约束和操作顺序。为了从点云数据中估算这些模型,我们提出了Pokenet,这是一种深度神经网络,已在人类示范上进行训练。我们使用8,000个模拟和1,600个真实世界标注样本验证了我们的方法。与先前的方法相比,Pokenet在真实世界数据中提高了关节轴和状态估计超过20%。最后,我们使用基于逆向动力学的规划在萨沃亚(Sawyer)机器人上展示了OKSMs,以操纵多DoF物体。
发布时间: 5/13/2025
查看原文
作者: Qing-Hong Cao, Zong-Yue Hou, Ying-Ying Li, Xiaohui Liu, Zhuo-Yang Song, Liang-Qi Zhang, Shutao Zhang, Ke Zhao
arXiv:2505.06347v1 类型: 交叉学科 摘要:我们提出了一种自动化的量子电路设计框架,通过将大型语言模型(LLMs)与进化优化结合起来,克服了传统变分量子算法在灵活性、可扩展性和对专家依赖性方面的局限性。我们的方法(FunSearch)能够自主发现硬件友好的制备态,带有可扩展性和独立于系统规模的数量的变分参数的全新特征,完全从头开始。在n=9个量子位的Ising和XY自旋链上的演示显示了包含4个参数的电路,能够在不同系统规模下实现近乎精确的能量外推。在量子硬件(Zuchongzhi芯片)上的实现验证了其实用性,在如此大的自旋链系统(多达20个站点)中,可以通过零噪声外推有效减轻两量子位量子门噪声。该框架将算法设计与实验限制相结合,补充了当前的可扩展量子模拟架构搜索框架,以推进可扩展的量子模拟。
发布时间: 5/13/2025
查看原文
作者: Jinsheng Yuan, Yuhang Hao, Weisi Guo, Yun Wu, Chongyan Gu
arXiv:2505.06335v1 宣布类型: cross 摘要:联邦学习(FL)有可能在大量并行代理之间同时进行全球学习,从而使诸如LLM之类的新兴AI能够在人口统计学上多样化的数据上进行训练。这一过程的关键在于联邦学习能够有效地执行稀疏梯度更新和远程直接内存访问,这种能力可以在中央服务器上实现。目前,FL安全领域的大多数研究都集中在保护边缘客户端的数据隐私或客户端与服务器之间的通信通道。客户端针对服务器的攻击较少被研究,因为在假设众多客户端能够提供弹性的情况下,服务器被视为安全的。 在这里,我们展示了通过攻击某些导致服务器频繁重复内存更新的客户端,可以在远程引发rowhammer攻击,从而攻击服务器内存。这是首次无需后门访问服务器,并且一个强化学习(RL)攻击者能够通过操纵客户端的传感器观察来学会最大化服务器的重复内存更新。远程rowhammer攻击的后果是能够实现位翻转,从而破坏服务器内存。我们使用大规模的FL自动语音识别(ASR)系统和稀疏更新来验证了这种攻击的可行性,在目标服务器模型中,我们的 adversarial攻击代理能够实现约70%的重复更新率(RUR),有效地在服务器DRAM上诱导位翻转。安全影响是可能导致学习中断或无意中导致特权提升,这为在FL和硬件设计中进行进一步的实际缓解策略研究铺平了道路。
发布时间: 5/13/2025
查看原文
作者: Chathurangi Shyalika, Renjith Prasad, Fadi El Kalach, Revathy Venkataramanan, Ramtin Zand, Ramy Harik, Amit Sheth
arXiv:2505.06333v1 宣告类型: cross 摘要:在现代装配流水线中,识别异常对于确保产品质量和运营效率至关重要。传统的单一模态方法在复杂的数据丰富且多模态的预测环境中难以捕捉到精确异常预测所需的高度复杂的相互关系。本文提出了一种神经符号AI和融合方法,用于装配流水线中的多模态异常预测。我们引入了一种基于时间序列和图像的融合模型,利用决策级融合技术。我们的研究基于多模态学习的三个主要新颖方法:基于时间序列和图像的决策级融合建模、融合的迁移学习以及蕴含知识的学习。我们使用我们推导的公开可用的多模态数据集评估了新型方法,并开展了全面的消融研究,以评估我们的预处理技术和融合模型相对于传统基线的影响。结果表明,基于神经符号AI的融合方法,利用迁移学习,能够有效利用时间序列和图像数据的补充优势,提供一种在装配流水线异常预测中更为稳健且可解释的方法,性能得到增强。 数据集、重现结果的代码、补充材料和演示可在 https://github.com/ChathurangiShyalika/NSF-MAP 上获取。
发布时间: 5/13/2025
查看原文
作者: Feilong Jiang, Xiaonan Hou, Jianqiao Ye, Min Xia
arXiv:2505.06331v1 宣告类型: cross 摘要: 物理知情神经网络(PINNs)是一类通过直接将在损失函数中纳入物理法则来解决偏微分方程的深度学习模型。然而,内部协变量偏移,这个问题已被广泛忽视,阻碍了PINNs中神经网络容量的有效利用。为了解决这一问题,我们提出了Mask-PINNs,这是一种新型架构,旨在解决PINNs中的这一问题。与传统归一化方法(如BatchNorm或LayerNorm)不同,我们引入了一个可学习的非线性掩码函数,该函数约束特征分布而不违反底层物理法则。实验结果表明,所提出的方法显著提高了各种激活函数和偏微分方程基准测试中特征分布的稳定性、准确性和鲁棒性。此外,它还使更宽的网络能够稳定高效地训练,而这一点在PINNs中早已被忽视。
发布时间: 5/13/2025
查看原文
作者: Junyu Xue, Xudong Wang, Xiaoling He, Shicheng Liu, Yi Wang, Guoming Tang
arXiv:2505.06330v1 宣布类型: cross 摘要: 非侵入式负荷监测(NILM)目标是将总的 household 电能消耗分解为单个家电的使用情况,从而使能更有效的能源管理。尽管深度学习推进了 NILM 的发展,但仍受限于对标注数据的依赖、有限的泛化能力和缺乏可解释性。在本文中,我们引入了首个基于提示的 NILM 框架,利用大规模语言模型(LLMs)结合上下文学习。我们设计并评估了结合家电特征、时间戳和上下文信息的提示策略,以及代表性的时间序列示例,使用 REDD 数据集进行评估。通过优化提示,LLMs 实现了具有竞争力的状态检测准确性,平均 F1 分数达到 0.676,无需微调即可展示其强健的泛化能力。LLMs 通过提供清晰的、易于理解的解释增强了预测的可解释性。我们的结果表明,LLMs 可以减少数据需求、提高适应性,并在 NILM 应用中提供透明的电能细分。
发布时间: 5/13/2025
查看原文
arXiv:2505.06326v1 宣传类型: 交叉 摘要:生成型人工智能是一种强有力的新技术,有可能在许多行业中提升创新和重塑治理。然而,组织在扩展生成型人工智能 (GenAI) 方面面临着重大挑战,包括技术复杂性、治理缺口和资源配置不当。本研究探讨了企业架构管理如何满足大型企业在采用生成型人工智能方面所面临的复杂需求。基于对现有文献的系统性回顾以及对16名专家进行的半结构化访谈的定性分析,该研究考察了企业架构管理和生成型人工智能采用之间的关系。回顾发现,现有的企业架构框架存在一些关键局限性,尤其是它们无法充分解决生成型人工智能的独特需求。通过使用Gioia方法进行分析,访谈揭示了不同行业中生成型人工智能采用的关键促进因素和障碍。研究结果表明,当作为感知、抓住和变革动态能力来理论化时,企业架构可以提高生成型人工智能的采用率,通过改善战略一致性、治理框架和组织敏捷性。然而,研究还指出了需要针对生成型人工智能特定挑战进行定制企业架构框架的需求,包括数据治理成熟度低以及创新与合规之间的平衡问题。提出了一些概念框架,以指导企业架构领导者将生成型人工智能成熟度与组织准备度相协调。这项工作通过对制存在破坏性技术环境中的创新和治理角色的阐明,为学术界和行业实践做出了贡献。
发布时间: 5/13/2025
查看原文