LLM2D

摘要

arXiv:2503.18258v2 宣告类型: replace-cross 摘要：已证明深度神经网络会学习并依赖于它们所训练的数据中存在的虚假相关性。依赖这些虚假相关性会使这些网络在现实世界中部署时发生故障，因为在现实世界中这些相关性可能不再成立。为克服学习和依赖这些虚假相关性，近期研究提出了能够取得良好结果的方法。然而，这些研究主要关注虚假信号的强度远大于内在不变信号强度的情景，使得检测单独训练样本中的虚假特征变得相对容易，并允许进一步处理。在这篇论文中，我们识别出了一种新的情景，在这种情景中虚假信号的强度相对较弱，使得难以检测到虚假信息的存在，同时仍然会导致灾难性的后果。我们还发现，大部分虚假相关性主要是由于极少数包含虚假特征的样本而被学习，开发了一种新的数据修剪技术，识别并修剪包含这些样本的小数据子集。我们提出的技术不需要推断的领域知识、有关样本级虚假信息的存在或性质的信息，或人类干预。最后，我们展示了这种数据修剪在先前研究中虚假信息可识别的情景中取得了最先进的性能。