Pytorch-geometric: Creating Message Passing Networks 构建消息传递网络教程

Posted 2023-01-22 LeonYiLeonYi

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了Pytorch-geometric: Creating Message Passing Networks 构建消息传递网络教程相关的知识，希望对你有一定的参考价值。

Pytorch-geometric: Creating Message Passing Networks 构建消息传递网络教程

一、背景
二、MessagePassing基类
三、例子
- 3.1 实现GCN层
- 3.2 实现EdgeConv层
参考文献

一、背景

将卷积运算推广到不规则域通常表示为邻局聚合(neighborhood aggregation)或消息传递(neighborhood aggregation)模式。

$\\mathbfx^(k-1)_i \\in \\mathbbR^1 \\times D$ 表示节点 $i$ 在第 $(k - 1)$ 层的节点特征， $\\mathbfe_j,i \\in \\mathbbR^1 \\times F$ 表示节点 $j$ 到节点的 $i$ 边特征（可选的），消息传递图神经网络可以描述为：
$\\mathbfx_i^(k) = \\gamma^(k) \\left( \\mathbfx_i^(k-1), \\square_j \\in \\mathcalN(i) \\, \\phi^(k)\\left(\\mathbfx_i^(k-1), \\mathbfx_j^(k-1),\\mathbfe_j,i\\right) \\right),$

其中, $\\square$ 表示可微且置换不变的聚合函数(aggregation function)，例如, sum、mean或max，消息函数(message function) $\\phi$ 和更新函数(update function) $\\gamma$ 均为可微函数，例如MLP。

值得注意的是，一般GNN论文中通常给出的是聚合邻居信息的Aggregator和更新节点表示Updator，其Aggregator对应pytorch-geometric(PyG)中的消息函数和聚合函数。GNN本质上还是在做特征传播。

$\\mathbfx_\\mathcalN_i^(k)=\\text AGGREGATE _(k)\\left(\\left\\\\mathbfx_j^(k-1), \\forall j \\in \\mathcalN_i\\right\\\\right)$ $\\mathbfx_i^(k)=\\sigma\\left(\\mathbfW^(k) \\cdot\\left[\\mathbfx_i^(k-1) \\| \\mathbfx_\\mathcalN_i^(k)\\right]\\right)$

例如，在GraphSage中，消息函数直接获取邻居节点 $\\in \\mathcalN_i$ 在第 $k - 1$ 层的嵌入，然后使用mean、max或LSTM作为聚合函数，更新函数将邻居中间嵌入和目标节点 $i$ 自身嵌入拼接后做线性变化。

$\\alpha_i j=\\frac\\exp \\left(\\text Leaky ReLU \\left(\\mathbfa^T\\left[\\mathbfW \\mathbfx_i \\| \\mathbfW \\mathbfx_j\\right]\\right)\\right)\\sum_k \\in \\mathcalN_i \\exp \\left(\\text Leaky ReLU \\left(\\mathbfa^T\\left[\\mathbfW \\mathbfx_i \\| \\mathbfW \\mathbfx_k\\right]\\right)\\right)$ $\\mathbfx_i^\\prime=\\|_k=1^K \\sigma\\left(\\sum_j \\in \\mathcalN_i \\alpha_i j^k \\mathbfW^k \\mathbfx_j\\right)$
又例如，在GAT中，消息函数根据注意力系数对节点嵌入进行归一化，然后使用"add"作为聚合函数。

二、MessagePassing基类

PyG的torch_geometric.nn中提供了MessagePassing基类，它通过自动处理消息传播来帮助创建此类消息传递图神经网络。用户只需重新定义 $\\phi$ message()和 $\\gamma$ update()及aggregation聚合方式（函数），例如aggr="add", aggr="mean" or aggr="max"，就可以实现自己GNN模型。

借助以下4个方法可实现上述目的：
MessagePassing(aggr="add", flow="source_to_target", node_dim=-2)：定义要使用的聚合方案（"add"，"mean"或"max"）和消息传递的流向（"source_to_target"或"target_to_source"）。此外，node_dim属性指明沿哪个轴传播。

MessagePassing.propagate(edge_index, size=None, **kwargs): 开始传播消息的初始调用。它接收边索引edge_index和构造消息所需的所有其他数据，来更新节点嵌入。propagate()不仅可以在[N, N]的方矩中交换消息，还可通过传入size=(N, M)作为附加参数传递来交换形如[N, M]的稀疏分配矩阵（例如，推荐系统中的二部图）中的消息。如果size设为None，则矩阵为方阵。

MessagePassing.message(...)：类似 $\\phi$ ，构造每条边到节点 $i$ 的消息。若 flow="source_to_target"则 $\\in \\mathcalE$ 和flow="target_to_source"则 $\\in \\mathcalE$ 。它可接受最初传递给propagate()的任何参数。此外，传递给propagate()的tensors可通过添加后缀_i和_j到变量名（例如，x_i和x_j）映射到对应的节点 $i$ 和 $j$ 。根据习惯，通常用 $i$ 表示聚合信息的中心节点（目标target），并用 $$(function () { $('#manual').addClass('current'); $('#manual').parent('ul').addClass('in'); })$