LLM2D
StealthRank:通过隐蔽的提示优化进行大语言模型排名操纵
StealthRank: LLM Ranking Manipulation via Stealthy Prompt Optimization
作者: Yiming Tang, Yi Fan, Chenxiao Yu, Tiankai Yang, Yue Zhao, Xiyang Hu
发布日期: 4/10/2025
arXiv ID: oai:arXiv.org:2504.05804v1

摘要

arXiv:2504.05804v1 交叉类型公告 摘要:将大语言模型(LLMs)集成到信息检索系统中引入了新的攻击面,特别是针对对抗性排名操纵。我们提出了一种名为StealthRank的新型对抗性排名攻击,它在保持文本流畅性和隐蔽性的同时,操纵LLM驱动的产品推荐系统。不同于现有方法通常会引入可检测的异常,StealthRank采用了基于能量的优化框架结合兰格维恩动力学,生成StealthRank提示(SRP),这是一种嵌入在产品描述中的对抗性文本序列,它虽微小但有效影响LLM排名机制。我们跨多个LLM评估了StealthRank,证明了它能够在不留下明显的操纵痕迹的情况下,隐蔽地提升目标产品的排名。我们的结果表明,StealthRank在有效性和隐蔽性方面均优于最先进的对抗性排名基线,突显了LLM驱动的推荐系统中的关键漏洞。