LLM2D
StruPhantom:由大型语言模型驱动的黑盒表格型代理的进化注入攻击
StruPhantom: Evolutionary Injection Attacks on Black-Box Tabular Agents Powered by Large Language Models
作者: Yang Feng, Xudong Pan
发布日期: 4/15/2025
arXiv ID: oai:arXiv.org:2504.09841v1

摘要

arXiv:2504.09841v1 类别: cross 摘要:大型语言模型(LLMs)驱动的自主代理的泛滥已经彻底改变了处理表格数据的流行商业应用,即表格代理。尽管观察到LLMs对来自外部数据源的提示注入攻击易受攻击,但表格代理对攻击者载荷施加了严格的格式和预定义规则,除非代理导航多层结构数据以整合载荷,这些规则才无效。为应对这一挑战,我们提出了一种名为StruPhantom的新攻击,专门针对黑盒LLM驱动的表格代理。我们的攻击设计了一种进化优化程序,通过提出的受限蒙特卡罗树搜索(MCTS)增强,并结合了一个离题评估器,持续优化攻击载荷。StruPhantom有助于系统地探索和利用目标应用的弱点,以实现目标劫持。我们的评估证明了StruPhantom在各种基于LLM的应用程序中的有效性,包括实时平台上的应用程序和攻击场景。我们的攻击在强制应用程序响应包含钓鱼链接或恶意代码的成功率上比基准高出50%以上。