摘要
arXiv:2504.05804v1 交叉类型公告
摘要:将大语言模型(LLMs)集成到信息检索系统中引入了新的攻击面,特别是针对对抗性排名操纵。我们提出了一种名为StealthRank的新型对抗性排名攻击,它在保持文本流畅性和隐蔽性的同时,操纵LLM驱动的产品推荐系统。不同于现有方法通常会引入可检测的异常,StealthRank采用了基于能量的优化框架结合兰格维恩动力学,生成StealthRank提示(SRP),这是一种嵌入在产品描述中的对抗性文本序列,它虽微小但有效影响LLM排名机制。我们跨多个LLM评估了StealthRank,证明了它能够在不留下明显的操纵痕迹的情况下,隐蔽地提升目标产品的排名。我们的结果表明,StealthRank在有效性和隐蔽性方面均优于最先进的对抗性排名基线,突显了LLM驱动的推荐系统中的关键漏洞。