arXiv:2502.08610v1 安全类型: 横跨领域
摘要:随着人工智能系统融入关键基础设施,人工智能合规框架中的安全缺口亟需引起重视。本文对三大主要的人工智能治理标准——NIST AI RMF 1.0、英国的AI和数据保护风险工具包以及欧盟的ALTAI——进行了审计和定量分析。采用一种新颖的风险评估方法,我们开发了四项关键指标:风险严重性指数(RSI)、攻击潜力指数(AVPI)、合规-安全缺口百分比(CSGP)和根本原因脆弱性评分(RCVS)。我们的分析在这些框架中发现了136个关注点,揭示了显著的安全缺口。NIST无法解决识别出的风险的69.23%,ALTAI拥有最高的攻击向量脆弱性(AVPI = 0.51),而ICO工具包拥有最大的合规-安全缺口,高达80.00%的高风险关注点仍未得到解决。根本原因分析指出,ALTAI中未明确规定的过程(ALTAI RCVS = 0.33)和NIST及ICO中薄弱的实施指导(NIST和ICO RCVS = 0.25)是关键弱点。这些发现强调了在人工智能合规中需要更强有力的可执行安全控制措施。我们提出了针对性的建议,以提高安全态势,并弥合合规与实际人工智能风险之间的差距。
arXiv:2502.08606v1 推广类型: 交叉
摘要: 我们提供了一种蒸馏缩放定律,可以根据计算预算及其在学生模型和教师模型之间的分配来估算蒸馏模型的性能。我们的发现降低了大规模使用蒸馏带来的风险;现在可以根据最大化学生模型性能的目的,为教师模型和学生模型分配计算资源。我们提供了在以下两种情况下的计算最优蒸馏配方:1) 当存在教师模型时,或 2) 当需要对教师模型进行训练时。如果要蒸馏大量学生模型,或者已经存在教师模型,那么直到计算资源水平达到预期增长的学生规模之前,蒸馏的表现都会优于监督预训练。如果只蒸馏一个学生模型且教师模型也需要训练,那么应该采用监督学习。此外,我们还提供了一项大规模蒸馏研究中的见解,这些见解增加了我们对蒸馏的理解,并为实验设计提供参考。
arXiv:2502.08605v1 Announce Type: cross
摘要:复杂网络的固有曲率是否揭示了传统方法忽视的图异常的钥匙?基于重建的图异常检测(Graph Anomaly Detection,GAD)方法忽视了这样的几何异常,只关注结构和属性级别的异常。为此,我们提出了CurvGAD——一种混合曲率的图自编码器,引入了基于曲率的几何异常的概念。CurvGAD引入了两个并行管道以增强异常可解释性:(1)曲率等变几何重建,该管道专注于使用混合曲率和黎曼编码器以及基于高斯核的解码器重建边的曲率;(2)曲率不变结构和属性重建,该管道通过在离散Ollivier-Ricci流下正则化图曲率,将结构和属性异常与几何不规则性分离,从而隔离非几何异常。通过利用曲率,CurvGAD细化了现有的异常分类,并识别了新的曲率驱动异常。在涵盖10个真实世界的数据集(无论是同质的还是异质的)的大量实验中,CurvGAD在最先进的GAD方法上显示出高达6.5%的性能提升。
arXiv:2502.08597v1 交叉类型
摘要:我们分析了在具有随机收益的资产市场中异质学习代理的表现。这些代理的目标是最大化其财富的预期增长率,但对如何做到这一点有不同的理论。我们重点关注比较贝叶斯学习者和无遗憾学习者在市场动态中的表现。具有正先验概率的有限模型集合上先验的贝叶斯学习者,在后验概率上以指数形式收敛到正确的模型。因此,即使存在根据正确过程模型进行投资的代理,它们也能生存下来。具有连续先验的贝叶斯学习者以 $O((\log T)/T)$ 的速率收敛到正确的模型。在线学习理论为在这种情况下最大化财富的对数提供了无遗憾算法,无需假设稳定的背景随机过程,且相对于最佳固定投资规则实现了最坏情况遗憾界为 $O(\log T)$。正如我们观察到的,这种遗憾与具有连续先验的贝叶斯学习者的遗憾量级相同。然而,我们证明了即使如此低的遗憾也可能不足以在资产市场上生存:一个代理可以拥有 $O(\log T)$ 的遗憾,但在与根据正确模型进行投资的代理或甚至与具有有限先验的完美贝叶斯学习者竞争时,仍然可能在市场动态中消失。另一方面,我们证明了贝叶斯学习是脆弱的,而无遗憾学习需要较少的环境知识,因此更加稳健。任何无遗憾学习者都会驱逐出市场一个不完美的贝叶斯学习者,后者的有限先验或更新规则甚至有小错误。我们正式建立了经济学中研究的生存、消失和市场主导概念与遗憾最小化框架之间的关系,从而将这些理论联系起来。
arXiv:2502.08586v1 安全公告类型:交叉
摘要:近期大量的机器学习安全文献集中在针对对齐的大语言模型(LLMs)的攻击上。这些攻击可能会提取私人信息或将模型诱使其生成有害输出。在实际部署中,LLMs 往往是更大代理管道的一部分,其中包括内存系统、检索、网络访问和API调用。这些额外的组件引入了漏洞,使得这些由LLM支持的代理比孤立的LLM更容易被攻击,但相对较少的工作关注LLM代理的安全性。在本文中,我们分析了仅存在于LLM代理的安全和隐私漏洞。我们首先提供了一种攻击分类体系,根据威胁行为者、目标、入口点、攻击者可观察性、攻击策略以及代理管道的固有漏洞进行分类。然后,我们对流行的开源和商用代理进行了系列示例攻击,展示了其漏洞的即时实践影响。值得注意的是,我们的攻击非常容易实施,不需要了解机器学习。
arXiv:2502.08577v1 交叉公告类型:跨领域
摘要:近年来,联邦学习(FL)已经成为在高度隐私关切领域训练机器学习模型的一种流行解决方案。然而,在实际部署中,当设备之间的数据分布为非独立非同分布(non-IID)时,FL的可扩展性和性能面临着显著的挑战。数据分布的异质性通常源于设备的空间分布,这在没有适当处理的情况下会导致模型性能下降。此外,联邦学习典型依赖于集中式架构,这在大规模应用或动态环境中带来了瓶颈和单点故障的风险。为填补这一空白,我们提出了一种基于场的联邦学习(FBFL),这是一种利用宏编程和场协调的新颖方法,通过以下方式解决这些限制:(i)分布式的基于空间的领导者选举,以减轻非-IID数据挑战;(ii)使用先进的宏编程模式构建一个自我组织的分层架构。此外,FBFL不仅克服了上述限制,还使开发专门针对每个子区域数据分布的模型成为可能。本文对FBFL进行了形式化定义,并使用MNIST、FashionMNIST和扩展的MNIST数据集进行了广泛评估。我们证明,在IID数据条件下,FBFL的表现与广泛使用的FedAvg算法相当。此外,在具有挑战性的非-IID场景中,FBFL不仅优于FedAvg,还超越了专门设计用于应对非-IID数据分布的其他最先进的方法,如FedProx和Scaffold。此外,我们展示了FBFL自组织分层架构对服务器故障的抗御能力。
arXiv:2502.08576v1 交叉公告类型
摘要:生成式人工智能(GenAI)模型,如大型语言模型(LLMs)、GPT模型和扩散模型,最近在研究界和产业界引起了广泛关注。本文综述了GenAI模型在网络监控和管理中的应用,重点关注其显著用例,以及面临的挑战和机遇。我们讨论了GenAI模型在网络流量生成与分类、网络入侵检测、网络系统日志分析以及网络数字助手方面如何发挥作用。此外,我们对可用的GenAI模型、大规模训练阶段的数据集以及此类模型开发的平台进行了综述。最后,我们讨论了可能缓解GenAI在网络安全监控和网络管理中推广障碍的研究方向。我们的研究旨在描绘当前的格局,并为进一步利用GenAI进行网络监控和管理的研究铺平道路。
arXiv:2502.08574v1 Announce Type: cross
摘要:我们介绍了因果操作器与自适应求解器变换器(COAST),这是一种新颖的神经操作符学习方法,利用因果语言模型(CLM)框架动态适应时间步长。该方法不仅预测系统的演化过程,还能预测其最优时间步长,智能地平衡计算效率和准确性。我们发现COAST生成的变步长与系统内在特性相关,无论是在同一动态系统内还是跨不同动态系统。在单个轨迹中,高复杂区域采取较小的时间步长,而在简单区域使用较大时间步长。在不同的系统中,更复杂的动态特性会接收更细粒度的时间步长。在具有不同动态特性的多种系统上进行基准测试,COAST始终优于最先进的方法,在效率和准确性方面表现更优。这项工作强调了基于CLM的智能自适应求解器在动态系统可扩展操作符学习方面的潜力。
arXiv:2502.08573v1 交叉公告类型:cross
摘要:随着人工智能和计算机视觉技术的发展,多模态情绪识别已成为一个突出的研究课题。然而,现有的方法在异构数据融合和模态相关性的有效利用方面面临挑战。本文基于对比学习和视觉序列压缩的集成,提出了一种新颖的多模态情绪识别方法,DeepMSI-MER。该方法通过对比学习增强跨模态特征融合,并通过利用视觉序列压缩减少视觉模态中的冗余。在两个公开数据集IEMOCAP和MELD上的实验结果表明,DeepMSI-MER 显著提高了情绪识别的准确性和鲁棒性,验证了多模态特征融合的有效性和所提出方法的有效性。
arXiv:2502.08560v1 Announce Type: cross
摘要:随着纵向磁共振成像(MRI)数据集的日益普及,人工智能(AI)驱动的疾病进展建模得以实现,使得预测患者的未来医学扫描成为可能。然而,尽管在AI方面取得了显著进展,当前的方法仍然面临着一些挑战,包括实现个体特异性、确保时空一致性、有效利用纵向数据以及管理3D扫描的大量内存需求。为了解决这些挑战,我们提出了一种名为Brain Latent Progression (BrLP)的新颖时空模型,用于在3D脑MRI中预测个体水平的疾病进展。BrLP的主要贡献有四个方面:(i)它在小的潜在空间中运行,缓解了高维成像数据带来的计算挑战;(ii)它明确整合了被试元数据,以增强预测的个体化;(iii)它通过辅助模型整合了疾病的先验知识,促进了纵向数据的集成;(iv)它引入了Latent Average Stabilization (LAS)算法,该算法在推断时确保了预测进展的时空一致性,并允许我们推导出预测的不确定性度量。我们在2,805名受试者的11,730张T1加权(T1w)脑MRI上对BrLP进行了训练和评估,并在外部分别包含2,257张MRI和962名受试者的测试集上验证了其泛化能力。我们的实验将BrLP生成的MRI扫描与实际的随访MRI进行了比较,证明了与现有方法相比达到了最先进的准确度。该代码可以在以下链接中公开获取:https://github.com/LemuelPuglisi/BrLP。