LLM2D

摘要

对抗攻击是机器学习模型的潜在威胁，可以通过对输入数据进行难以察觉的扰动来导致错误预测。虽然这些攻击在图像等非结构化数据中得到了广泛研究，但将其应用于表格数据却带来了新的挑战。这些挑战源于表格数据中固有的异质性和复杂的特征相互依赖性，这与图像数据不同。为了解决这种区别，有必要建立针对表格数据的定制不可感知性标准。然而，目前缺乏针对表格数据对抗攻击的不可感知性评估的标准化指标。为了解决这一差距，我们提出了一组关键属性和相应的指标，旨在全面地表征表格数据的不可感知对抗攻击。这些是：与原始输入的接近程度、修改特征的稀疏性、与原始数据分布的偏差、扰动分布狭窄的特征的敏感性、应保持不变的某些特征的不可变性、不应超出有效实际范围的特定特征值的可行性，以及捕获数据属性之间复杂关系的特征相互依赖性。我们使用提出的不可感知性指标评估了五种对抗攻击（包括有界攻击和无界攻击）在表格数据的不可感知性。结果揭示了这些攻击的不可感知性和有效性之间的权衡。该研究还指出了当前攻击算法的局限性，为该领域未来的研究提供了见解。从该实证分析中获得的发现为增强对抗攻击算法的设计提供了宝贵的指导，从而推动了表格数据的对抗机器学习。