LLM2D

摘要

arXiv:2311.11796v2 Announce Type: replace-cross 摘要：随着人工智能（AI）系统在自动驾驶车辆到生物特征认证等多种关键应用中发挥愈加重要的作用，它们面临可转移攻击的脆弱性成为一个日益严重的问题。这些设计用于跨样本、领域、模型、任务、模态，甚至硬件平台进行推广的攻击，对安全、隐私和系统完整性构成了严重的风险。本文综述了可转移攻击的首次全面审查，涵盖了七个主要类别，包括欺骗、后门攻击、数据污染、模型窃取、模型反演、成员推断和旁路攻击。我们引入了一个统一的六维度分类系统的概念：跨样本、跨领域、跨模态、跨模型、跨任务和跨硬件，这个框架系统地捕捉了各种敌对策略的多样转移路径。通过这一框架，我们探讨了可转移攻击对AI系统的潜在机械原理及其实践意义。此外，我们还回顾了提高攻击可转移性的最新方法，这些方法围绕数据扩增和优化策略组织起来。通过整合碎片化的研究并识别关键的未来方向，本文提供了理解、评估和防御现实世界AI系统中的可转移威胁的基础路线图。