图神经网络的研究现状及其在反欺诈领域的应用
Posted 数说吧
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了图神经网络的研究现状及其在反欺诈领域的应用相关的知识,希望对你有一定的参考价值。
01
图神经网络起源
在现实世界中,一个物体通常不是孤立存在的,会与其他的物体进行交互,如社交网络中的个体之间、交通网络的不同路口之间、转账关系的用户之间等。这表明物体的属性不仅与自身的特性相关,还可能与其发生交互的物体有关。图结构数据(下文简称:图数据)可以同时表达物体自身特征和物体之间的关系信息。因此,对图数据进行有效分析可以挖掘出更加全面的信息,有利于下游的任务的性能提升。
然而,传统的卷积神经网络、RNN等深度神经网络只能处理欧式空间的数据(如图像、文本、语音),而无法很好地处理非欧式距离的图数据[1]。因此,开发一套能够对图数据进行高效地信息提取的技术是非常有必要的。
02
图神经网络基本方法
近年来,随着深度学习在图像、文本等数据上取得了优异的效果,大量的研究人员开始使用深度神经网络从图数据中挖掘信息,并提出了图神经网络这一概念。图神经网络的核心思想是通过聚合邻居节点的信息对中心节点的信息进行补充,从而获得中心节点更加全面的信息。这与卷积神经网络的核心思想是相似的。不过,图数据和图像在结构上是不同的,如图像的一个点的邻居是固定的,而图数据中一个点的邻居是不固定的。Niepert等[2]将卷积神经网络归纳为3个步骤:(1)选取固定数量邻居节点;(2)给邻居节点编号;(3)参数共享,并基于此提出了可用于提取图数据信息的方法。
然而,该方法存在以下缺点:(1)选取固定数量的邻居节点会不可避免地丢弃掉一些节点,造成信息的丢失;(2)编号的顺序不一定合理,可能会引入噪声信息。在此基础上,研究人员提出了先求邻居节点信息的平均值,然后对聚合到的信息及自身信息分别进行投射并相加。经过非线性函数后,得到聚合后的节点信息。该方法能够解决上述两个缺点,但是其自身仍然存在一些缺点,如将所有的邻居节点是平等对待,而这经常与实际情况不相符。
为了弥补这一缺陷,后期又有一些方法提出,主要用于改进邻居节点聚合信息的方式,如GCN[3]、GraphSage[4]、GAT[5]等方法。下面分别对GCN、GraphSage和GAT进行概括性地介绍:
(1)GCN[3]。该方法主要是对聚合邻居信息的权重的计算方法进行了修改,使用中心节点和邻居节点的度(邻居节点个数)的乘积的开方的倒数来取代中心节点的度的倒数作为邻居节点的权重。这种方式在数学上是基于谱的图神经网络方法的近似(由于基于谱的图神经网络方法目前不是主流的发展方式且对数学理论要求很高,这里不展开介绍)。直观的理解是,两个相邻的节点,当它们度的乘积较小时,具有更高的关联性;反之,则具有较低的关联性。
(2)GraphSage[4]。该方法提出了池化、LSTM的邻居节点信息聚合的方式。通过实验表明,池化和LSTM的聚合方式相比GCN的方式有明显的优势。当然,GraphSage还提出了对邻居节点采样的方法并结合使用多个聚合器,能够实现批量化训练且尽可能地避免信息的丢失。这促使GraphSage可以应用在大规模图数据上并且在工业界得到了广泛应用。
(3)GAT[5]。邻居节点信息聚合的一个核心问题是区分不同邻居节点对中心节点的重要性。而注意力机制是让模型自动对不同特征采取不同关注度的策略,能够加强对重要信息的关注,同时忽略一些次要的信息。GAT的主要贡献是提出了基于注意力机制的邻居信息聚合方式。这种聚合方式通常具有较好的效果并得到了广泛的使用,但是其需要消耗较多的计算资源。
另外,一个节点的邻居节点中,可能会聚合成不同的簇,如社交关系中的家人、同事和同学会聚成三个簇。同一簇内的节点是相似的,而不同簇的节点之间存在较大的差异。因此,针对不同的簇采取不同的处理方式是有必要的。DisenGNN[6]是对这种现象进行建模的,让节点根据属性自动地聚合到相应的簇中,然后针对不同的簇采取特定的方式进行信息提取。
前面所述的方法都是假设节点是在同一幅图中。然而,在现实世界中,一个物体可能存在于多个图中,如一个人有社交关系、交易关系、转账关系等。单独的图反映了一个物体在某一方面的信息且它们彼此之间通常是不同的。而将多个图的信息在同一个图的框架下处理并不是很合适,甚至是无法处理的。针对此现象,R-GNNs[7]、R-GAT[8]等提出了先将多个图分开处理,然后对单个图的信息进行汇聚处理的解决方案。
在一些图中,边的属性信息也是非常丰富的,如在一个转账关系中,有转账的金额、次数、时间等。因此,充分利用边的属性信息也是很有必要的。EGNN[9]提出了同时融合节点和边的信息的聚合方式,将边的信息用于指导信息的聚合。
前面所述的都是在原有的图数据上处理的。除此之外,还可以先使用Meta-Path[10]表达图的局部数据,然后在此基础上抽取信息。HAN[11]、HACUD[12]等方法使用Meta-Path的方式能够很方便地表达图的局部信息、跨图信息、高阶信息并且能够批量化处理,很适合运用在大规模数据上并且取得了较好的效果。
03
图神经网络在反欺诈领域中的应用
在金融场景中,存在大量的交易、转账、社交等关系型数据,对这些数据进行有效地挖掘可以提高反欺诈的效果(当然,图神经网络还可以用于其他金融场景)。目前,图神经网络方法,如HACUD[12]、MAHINDER[13]、AMG[14]等,已经在支付宝、阿里巴巴等高科技企业得到了广泛使用并且取得了较好的实验结果。下面介绍一些使用图神经网络进行欺诈检测的方法。
(1)HACUD。该方法是用于判定信用卡用户是否存在套现的行为。它首先通过统计分析得到不同的社交关系对用户套现是否有影响,然后使用Meta-Path表达不同的关系信息,最后对Meta-Path上的信息进行提取得到用户的表示并判定是否会套现。通过在蚂蚁信用支付的数据上实验的结果可以看出,该方法相比Graph Embedding、GBDT等方法都有较大幅度的提升。
(2)MAHINDER。该方法是用于预测在线信用支付用户是否会逾期。它首先通过统计分析得出关系数据对用户逾期会有影响,不同的关系有不同的影响,而且在同一关系中不同类型的边的影响也不同。为此,该方法首先使用含有边信息的Meta-Path对图的局部结构进行表达,然后采用双LSTM同时对节点和边的信息进行提取并采用层级注意力机制自动地从节点、边、关系层面上抽取重要信息,从而得到节点在图内、跨图的低、高阶信息,最终用于判定用户是否会逾期。通过在阿里巴巴的数据上的结果可以看出,该方法相比GBDT、DeepForest、HAN、HACUD都有显著的提升,且AUC达到0.953,R@P0.1达到0.564。
(3)AMG。该方法是对贷款是否会逾期进行预测。它首先指出在信贷中存在以下现象:1)用户产生逾期的行为与邻居是有关联的;2)多维度的关系信息能够完善用户的信息;3)持有新卡的用户的自身信息较少需要通过关联用户的信息对其进行补充。然后提出了使用图神经网络对边和节点的信息进行建模,并在关系内和关系间分别使用注意力机制自动地识别关键信息,最后对用户是否存在贷款逾期行为进行预测。通过在支付宝信用支付数据上的实验结果可以看出,该方法相比传统的机器学习方法和图神经网络的方法,在未来的1-5个月的数据上进行预测,其AUC和K-S值都有显著的提升。
04
总结
在现实世界中,存在大量图数据,如社交关系、交易关系、购物关系等,因此从图数据中提取信息是很有必要的。而图神经网络可以从图数据中,同时提取节点和边的信息,获取更加全面的信息。目前,它在关系信息比较丰富的场景,如反欺诈检测、推荐系统、交通预测等,得到了广泛应用并且取得了较好的效果。
参考文献
[1]徐冰冰, 岑科廷, 黄俊杰, et al. 图卷积神经网络综述[J]. 计算机学报, 2020, 043(005):755-780.
[2]M. Niepert, M. Ahmed, K. Kutzkov. Learning Convolutional Neural Networks for Graphs. ICML, 2016.
[3]Kipf T N, Welling M. Semi-supervised classification with graph convolutional networks[J]. arXiv preprint arXiv:1609.02907, 2016.
[4]Hamilton W, Ying Z, Leskovec J. Inductive representation learning on large graphs[C]//Advances in neural information processing systems. 2017: 1024-1034.
[5]Veličković P, Cucurull G, Casanova A, et al. Graph attention networks[J]. arXiv preprint arXiv:1710.10903, 2017.
[6]Ma J, Cui P, Kuang K, et al. Disentangled graph convolutional networks[C]//International Conference on Machine Learning. 2019: 4212-4221.
[7]Schlichtkrull M, Kipf T N, Bloem P, et al. Modeling relational data with graph convolutional networks[C]//European Semantic Web Conference. Springer, Cham, 2018: 593-607.
[8]Busbridge D, Sherburn D, Cavallo P, et al. Relational graph attention networks[J]. arXiv preprint arXiv:1904.05811, 2019.
[9]Gong L, Cheng Q. Exploiting edge features for graph neural networks[C]//Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition. 2019: 9211-9219.
[10]Sun Y, Han J, Yan X, et al. Pathsim: Meta path-based top-k similarity search in heterogeneous information networks[J]. Proceedings of the VLDB Endowment, 2011, 4(11): 992-1003.
[11]Wang X, Ji H, Shi C, et al. Heterogeneous graph attention network[C]//The World Wide Web Conference. 2019: 2022-2032.
[12]Hu B, Zhang Z, Shi C, et al. Cash-out user detection based on attributed heterogeneous information network with a hierarchical attention mechanism[C]//Proceedings of the AAAI Conference on Artificial Intelligence. 2019, 33: 946-953.
[13]Zhong Q, Liu Y, Ao X, et al. Financial Defaulter Detection on Online Credit Payment via Multi-view Attributed Heterogeneous Information Network[C]//Proceedings of The Web Conference 2020. 2020: 785-795.
[14]Hu B, Zhang Z, Zhou J, et al. Loan Default Analysis with Multiplex Graph Learning[J]. institutions, 11: 25.
◆ “工作随笔”欢迎投稿:
xiaoyao@abchina.com
以上是关于图神经网络的研究现状及其在反欺诈领域的应用的主要内容,如果未能解决你的问题,请参考以下文章