摘要
arXiv:2504.04861v1 类型: cross
摘要:文本交互网络(TINs)是一种广泛使用的数据结构,用于建模电子商务网站、社交网络等场景中用户和物品之间的交互,其中每个交互都关联有一个文本描述。对这类文本交互(TIC)进行分类在电子商务中的虚假评论检测、金融中的欺诈交易检测等方面具有广泛的应用。现有的TIC解决方案要么由于使用上下文无关的文本嵌入未能捕捉丰富的文本语义,要么忽视了TINs的二分结构和节点异构性,导致TIC性能受到影响。在本文中,我们提出了一种称为SAFT的新架构,该架构结合了基于语言和图的模块,用于有效融合交互中的文本和结构语义。特别是,通过利用线图注意力(LGA)/门控注意力单元(GAUs)和预训练语言模型(PLMs)来建模交互级和标记级信号,并通过代理标记在迭代和上下文化的方式下进一步耦合。此外,我们开发了一种高效且理论依据的方法,用于将交互相关的局部和全局拓扑信息编码到结构嵌入中。生成的嵌入不仅将TINs下的结构特征注入到文本交互编码中,而且有助于设计图采样策略。在多个真实TIN数据集上的广泛实证评估表明,SAFT在TIC准确性方面优于最新的基线方法。