基于翻译的嵌入模型——TransE
Posted real-zz-11
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了基于翻译的嵌入模型——TransE相关的知识,希望对你有一定的参考价值。
多元关系数据及其表示形式
多元关系数据是经常会用到的关系型数据,由结点和联结结点的边组成,知识图谱就是一种多元关系数据库,如图所示。
结点表示了实体,边表示实体与实体之间存在的关系。这样形成的网络通常可以拆解为多个结点存在重复的三元组形式(head,relation,tail),称为一个事实(fact)。
其中,head和tail表示实体,relation表示二者关系,当head与tail之间的关系并非向量(有向关系,如同学,即等价关系时)时,(head,relation,tail)=(tail,relation,head)。
模型思想及简介
本篇文章的目的就是构建一个嵌入模型,将这样的数据关系网络简洁高效地嵌入到数学模型中,并提供自动添加事实的功能,而不需要人工提供额外的知识。主要思想是通过提取已有数据关系中的模式,利用该模式对已存在的实体与关系(两者没有对应关系)进行预测。最简单的推导过程如:(张,同学,李)+(张,同学,王)=>(李,同学,王)。
TransE模型以关系relation为核心,选用关系模型中的关系的一个低维向量来表示关键关系(key),是一种嵌入到低维模型的平移转换,头尾实体的嵌入依赖于该关系所产生的低维向量,因此关系可以看做嵌入转换过程中的翻译,也称为翻译模型。一开始这个模型是为具有层次结构的知识图谱服务的,实际应用后对大部分结构都适用,且能应用于大规模实体-关系图上。
若有三元组(h, r, t)成立,h, r, t均为向量形式,若定义一个距离函数d(h+r,t)度量h+r与t之间的距离
那么对于已存在的(h, r, t)有 h + r ≈ t ; 对于不存在的(h, r, t),则要使得 h + r 与 t 间隔相当远。
(还未写完)
以上是关于基于翻译的嵌入模型——TransE的主要内容,如果未能解决你的问题,请参考以下文章
论文解读:(TransE)Translating Embeddings for Modeling Multi-relational Data