Chap03知识抽取与挖掘

Posted cs-learn

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Chap03知识抽取与挖掘相关的知识,希望对你有一定的参考价值。

 

大纲

1.知识抽取任务定义和相关比赛

2.面向结构化数据的知识抽取

3.面向半结构化数据的知识抽取

4.实践展示:基于百科数据的知识抽取

技术分享图片

竞赛:MUC ACE KBP SemEval 

技术分享图片

 

 

 实体识别与链接

技术分享图片

关系抽取:从文本中抽取两个或两个以上实体的语义关系

技术分享图片

技术分享图片

监督学习——深度学习方法

Pipeline  JointModel

 技术分享图片

技术分享图片

技术分享图片

技术分享图片

技术分享图片

技术分享图片

 

面向结构化数据的知识抽取

 R2RML  Triples Maps 数据库表映射 视图映射

半结构化数据的知识抽取

百科类知识抽取(维基百科)

WEB网页数据抽取:包装器的生成

技术分享图片

技术分享图片

技术分享图片

技术分享图片

技术分享图片

技术分享图片

技术分享图片

技术分享图片

 

WEB TABLE:标注为RDF三元组,实体链接将表格中个单元的字符串映射到给定知识库的实体上

实践:基于百科数据的知识抽取——佛学知识图谱

抽取框架 主语融合 宾语融合 对infobox属性进行补全 在线接口

 属性-值抽取    实体清理

 

以上是关于Chap03知识抽取与挖掘的主要内容,如果未能解决你的问题,请参考以下文章

善用数据挖掘,获取隐藏知识

数据挖掘分类聚类算法学习摘要

机器学习算法与编程实践之中文文本分类

基于知识图谱的文本挖掘 - 超越文本挖掘

零基础学习大数据挖掘的33个知识点整理

中文文本分类