基于翻译的嵌入模型——TransE

Posted 2020-12-14 real-zz-11

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了基于翻译的嵌入模型——TransE相关的知识，希望对你有一定的参考价值。

多元关系数据及其表示形式

多元关系数据是经常会用到的关系型数据，由结点和联结结点的边组成，知识图谱就是一种多元关系数据库，如图所示。

技术图片

结点表示了实体，边表示实体与实体之间存在的关系。这样形成的网络通常可以拆解为多个结点存在重复的三元组形式（head，relation，tail），称为一个事实（fact）。

其中，head和tail表示实体，relation表示二者关系，当head与tail之间的关系并非向量（有向关系，如同学，即等价关系时）时，（head，relation，tail）=（tail，relation，head）。

模型思想及简介

本篇文章的目的就是构建一个嵌入模型，将这样的数据关系网络简洁高效地嵌入到数学模型中，并提供自动添加事实的功能，而不需要人工提供额外的知识。主要思想是通过提取已有数据关系中的模式，利用该模式对已存在的实体与关系（两者没有对应关系）进行预测。最简单的推导过程如：（张，同学，李）+（张，同学，王）=>（李，同学，王）。

TransE模型以关系relation为核心，选用关系模型中的关系的一个低维向量来表示关键关系（key），是一种嵌入到低维模型的平移转换，头尾实体的嵌入依赖于该关系所产生的低维向量，因此关系可以看做嵌入转换过程中的翻译，也称为翻译模型。一开始这个模型是为具有层次结构的知识图谱服务的，实际应用后对大部分结构都适用，且能应用于大规模实体-关系图上。

若有三元组（h, r, t）成立，h, r, t均为向量形式，若定义一个距离函数d(h+r,t)度量h+r与t之间的距离

那么对于已存在的（h, r, t）有 h + r ≈ t ; 对于不存在的（h, r, t），则要使得 h + r 与 t 间隔相当远。

（还未写完）

原文《Translating Embeddings for Modeling Multi-relational Data》

以上是关于基于翻译的嵌入模型——TransE的主要内容，如果未能解决你的问题，请参考以下文章

JEMT模型

论文解读：（TransE）Translating Embeddings for Modeling Multi-relational Data

论文翻译DeepWalk: Online Learning of Social Representations

基于RNN的语言模型与机器翻译NMT

Keras深度学习实战——基于编码器-解码器的机器翻译模型

带有注意力的神经机器翻译中的嵌入层