LLM2D
基于云的 XAI 服务,用于评估对抗攻击下开放式存储库模型的安全性
Cloud-based XAI Services for Assessing Open Repository Models Under Adversarial Attacks
作者: Zerui Wang, Yan Liu
发布日期: 10/2/2024
arXiv ID: oai:arXiv.org:2401.12261v4

摘要

人工智能模型的不透明性要求在将其集成到服务之前进行验证和评估。为了研究这些模型,可解释人工智能 (XAI) 采用了一些方法来阐明输入特征和输出预测之间的关系。XAI 的操作超越了单个算法的执行,涉及一系列活动,包括预处理数据、调整 XAI 以与模型参数保持一致、调用模型以生成预测以及总结 XAI 结果。对抗性攻击是众所周知的威胁,旨在误导人工智能模型。由于各种组合,当开源人工智能模型受到对抗性攻击时,评估复杂性,尤其是对于 XAI,会增加。为了自动化 XAI 基于评估中涉及的众多实体和任务,我们提出了一种基于云的服务框架,该框架将计算组件封装为微服务,并将评估任务组织成管道。当前的 XAI 工具本质上不是面向服务的。该框架还将开放的 XAI 工具库集成到管道组合中。我们展示了 XAI 服务在评估人工智能模型的五个质量属性方面的应用:(1)计算成本,(2)性能,(3)鲁棒性,(4)解释偏差,以及(5)跨计算机视觉和表格案例的解释弹性。服务框架生成汇总分析,展示了超过一百种组合场景的质量属性。