摘要
本文介绍了“图特征预处理器”,这是一个软件库,用于实时检测金融交易图中常见的洗钱模式。这些模式被用来生成丰富的交易特征,用于下游机器学习训练和推理任务,例如检测欺诈性金融交易。我们证明了我们丰富的交易特征极大地提高了基于梯度提升的机器学习模型的预测精度。我们的库利用多核并行性,维护动态内存中的图,并在传入的交易流中有效地挖掘子图模式,使其能够以流式方式运行。我们的解决方案结合了图特征预处理器和基于梯度提升的机器学习模型,能够在反洗钱和网络钓鱼数据集上检测出比标准图神经网络更高的少数类F1分数的非法交易。此外,我们的解决方案在多核CPU上执行的端到端吞吐率超过了在强大的V100 GPU上执行的图神经网络基线。总的来说,我们的解决方案的高精度、高吞吐率和低延迟的结合证明了我们的库在实际应用中的实用价值。