LLM2D

摘要

arXiv:2502.09782v3 宣告类型: replace-cross 摘要：随着日常设备中麦克风的普及和对在线服务的依赖增加，键盘遭受到声学侧信道攻击（ASCAs）的风险也逐渐增大。本研究探索了深度学习技术，尤其是视觉变换器（VTs）和大型语言模型（LLMs），以提高这些攻击的有效性和适用性。我们在此前研究的基础上取得了显著改进，CoAtNet模型实现了最先进的性能。与之前的基准相比，CoAtNet模型在通过智能手机（Phone）记录的按键记录上提升了5.0%，在通过Zoom记录的按键记录上提升了5.9%。我们还评估了变压器架构和语言模型，最好的VT模型与CoAtNet的性能相当。一个重要的进展是引入了一种用于现实场景的降噪方法。通过使用LLMs进行上下文理解，我们能够检测并纠正嘈杂环境中错误的按键记录，从而提高ASCAs的性能。此外，通过Low-Rank Adaptation（低秩适应）微调的轻量级语言模型实现了与具有67倍更多参数的大型模型相当的性能。这一VT和LLM的结合提高了ASCAs缓解的实际适用性，标志着首次将这些技术用于现实场景中的ASCAs和错误纠正。