LLM2D

摘要

arXiv:2504.05804v1 交叉类型公告摘要：将大语言模型（LLMs）集成到信息检索系统中引入了新的攻击面，特别是针对对抗性排名操纵。我们提出了一种名为StealthRank的新型对抗性排名攻击，它在保持文本流畅性和隐蔽性的同时，操纵LLM驱动的产品推荐系统。不同于现有方法通常会引入可检测的异常，StealthRank采用了基于能量的优化框架结合兰格维恩动力学，生成StealthRank提示（SRP），这是一种嵌入在产品描述中的对抗性文本序列，它虽微小但有效影响LLM排名机制。我们跨多个LLM评估了StealthRank，证明了它能够在不留下明显的操纵痕迹的情况下，隐蔽地提升目标产品的排名。我们的结果表明，StealthRank在有效性和隐蔽性方面均优于最先进的对抗性排名基线，突显了LLM驱动的推荐系统中的关键漏洞。