摘要
arXiv:2502.13471v1 Announce Type: cross
摘要:特征交互对于预测机器学习模型至关重要,因为它捕捉了影响模型性能的特征之间的关系。在这项工作中,我们关注成对交互,并探讨它们在为图神经网络(GNNs)构建特征图时的重要性。我们不是提出新的方法,而是利用现有的GNN模型和工具来探索特征图结构与其建模交互有效性之间的关系。通过在合成数据集上的实验,我们发现成对交互特征之间的边对于GNN有效建模特征交互是重要的。我们还观察到,包含非交互边可以作为噪声,降低模型性能。此外,我们使用Minimum Description Length(MDL)原则提供了稀疏特征图选择的理论支持。我们证明,仅保留必要交互边的特征图比完整图提供更高效且可解释的表示,符合奥卡姆剃刀原理。
我们的发现不仅提供了设计改进GNN模型性能和可解释性的特征图设计的理论洞察和实践指南。