知识图谱基础组件RDF、RDFS、OWL

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了知识图谱基础组件RDF、RDFS、OWL相关的知识,希望对你有一定的参考价值。

参考技术A

在知识图谱中,一个语句可以看做是一个知识
举个例子:猫是哺乳动物

每条知识标识为一个SPO三元组(Subject-Predicate-Object)
Subject : 主语
Predicate: 谓词
Object :宾语
在“猫是哺乳动物”这条知识中
猫:主语
是:谓词 用来描述或判定客体性质、特征或者客体之间关系的词项
动物:宾语

RDF(Resource Description Framework),资源描述框架,其本质是一个数据模型(Data Model)。它提供了一个统一的标准,用于描述实体/资源。RDF的作用就是描述上面提到的SPO三元组

将知识规范化之后,就是存储和传输的问题
目前,RDF序列化的方式主要有:RDF/XML,N-Triples,Turtle,RDFa,JSON-LD等几种。
下面介绍一种使用的最多的方式 Turtle
以伪满皇宫博物院知识图谱为例,网上有很多例子,自行参考

同一个实体的多个属性可以紧凑表示,注意每一条后面末尾分号 ; 和逗号 . 的区别

在第一篇文章中说过,RDF在使用的时候还有很多局限性,这种局限体现在对事物的抽象能力上,举个例子
猫是哺乳动物 ,这个知识在不同的语境中有不同的意思

这个时候简单的

无法具体的区分要表示的是哪种意思
这时候就需要扩展规则 RDFS

还是以上面伪满皇宫博物院为例
此时,我们就要区分实体和类的不同了,用RDFS描述下上面的知识图谱

介绍下其中的几个关键字

RDFS中还有很多关键字,如 rdfs:subClassOf 等,详细可以参考 W3C文档

相对于RDFS,可以更加细化图谱中的关系
例如:其中 wwww.kg.com/persion/1 可以看做是一个实体罗纳尔多, www.kg.com/place/10086 也是一个实体,代表罗纳尔多的出生地,但是他是一个实体,不是罗纳尔多实体的属性,所以,数据之间有两种关系

另外延伸想象,是不是可以让数据具有推理能力,举几个例子

经过这样的一些逻辑定义,就使得数据具有了逻辑推理能力,这些功能的扩展,可以通过OWL完成,具体的属性见 W3C文档
这样经过修改后,上面的知识图谱可以表示为

上例子中数据属性和实体属性分别用 owl:DatatypeProperty 和 owl:ObjectProperty 表示
OWL中还有很多其他适用于推理的字段,下面列举几个

在融合数据的时候,OWL也可以去到很好的作用,例如:A的数据中定义的一个Person1,B的数据中定义了一个Person2,假如这两个数据中定义的Person是一样的,那么当A数据和B数据融合的时候,就可以使用OWL很好的融合,避免数据的重复定义

本体映射主要有以下三种

OWL中这种关系描述的属性定义,可以大大的增加推理机制,使海量的数据再处理的时候,不用一个一个的补全之间的关系,只要定义属性关系就好

OWL 推理题

【中文标题】OWL 推理题【英文标题】:OWL inferencing question 【发布时间】:2011-06-08 01:09:42 【问题描述】:

我使用的是 Jena 语义网络框架 2.6.3 版。我有代码创建一个带有猫头鹰推理的模型,然后添加以下三元组:

_:bnode-3 rdf:type            owl:Restriction .

_:bnode-3 owl:onProperty      :offspringOf .

_:bnode-3 owl:someValuesFrom  :Person .

_:bnode-3 rdfs:subClassOf     :Person .

_:bnode-3 应该是一个限制类,例如,如果 :bob:Person 并且断言了以下三元组,则它将包含 :joe

:joe :offspringOf :bob . 

那么,由于限制类是 Person 的子类,:joe 也将是一个人。

事实上,这是可行的。令我困惑的是,在我只断言这篇文章顶部的 4 个三元组之后,推理器创建了一个空白节点,它是一个人。换句话说,以下三元组现在在模型中:

_:b0 rdf:type :Person

我不明白它为什么会这样做。对于理解这一点的任何帮助将不胜感激。

谢谢。 肯特。

【问题讨论】:

【参考方案1】:

由于我不是 OWL 专家,我不确定推理者为什么会这样做 - 您是否尝试在 jena-users 列表中提问?

他们通常会很快回答您,并且他们应该知道您为什么会得到观察到的行为。

注意

我重新格式化了您的问题,因为您的代码示例有些令人困惑 - 请不要将 Triples 写成 [ex:subject ex:predicate ex:object],因为它看起来很像 Turtle/N3/SPARQL 中的一些语法糖,这会导致创建额外的空白节点只是那些你想要的

【讨论】:

以上是关于知识图谱基础组件RDF、RDFS、OWL的主要内容,如果未能解决你的问题,请参考以下文章

[NLP] 语义网络与知识图谱入门

知识图谱表示

RDF/RDFS/OWL

浅析知识图谱构建

浅析知识图谱构建

知识工程基础-作业1