又双叒叕重磅推出!DMC第四讲:文本挖掘

Posted 中国人民大学数据挖掘中心

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了又双叒叕重磅推出!DMC第四讲:文本挖掘相关的知识,希望对你有一定的参考价值。

【又双叒叕重磅推出!】DMC第四讲:文本挖掘(二)

4月20日星期五 18:00-21:00

明德主楼 1030


背景介绍

经过上一场的文本挖掘概述以及中英文分词领域的综述和重点论文剖析,相信大家对文本挖掘过程中的复杂性、多样性有所了解和认识。分词、词组识别、命名实体识别均属于构建特征以及文本挖掘的上游工作,之后的文本分类、关系提取更能凸显文本挖掘的综合性和多样性。

文本分类是文本分析中最为常用也最为重要的任务,而关系提取是构建知识图谱的关键性工作,这两个领域一直是研究的热点。文本分类和关系提取一直有密不可分的关系,例如两者在近年的神经网络模型构建中,均用到了自动权重层(attention mechanism),且更为困难的关系提取工作常会转化为较为简单的文本分类来处理。


分享内容

第一部分:文本挖掘之文本分类(text classification)发展综述与经典论文剖析


第二部分:文本挖掘之关系提取(relation extraction)发展综述与经典论文剖析


第三部分:程序演示——从杂乱的原始文本中提取有价值的信息


阅读材料

本次报告的文章已经上传至网盘,请大家点击左下角的“阅读原文”进入DMC官网下载,并提前阅读,做好预习。另外由于会涉及神经网络的知识,请大家提前了解神经网络的基本概念。


小编寄语

文本挖掘—从文字到数字,从繁杂到规整,化冗余为神奇!

组长—DMC爆品组长林毓聪再现精彩内容!

组员—从大四到研二的大神让人眼花缭乱!



点击“阅读原文”下载报告材料!

以上是关于又双叒叕重磅推出!DMC第四讲:文本挖掘的主要内容,如果未能解决你的问题,请参考以下文章

DMC第三讲:文本挖掘

新学期第一弹:DMC口碑之作——文本挖掘

CSDN浏览器助手又双叒叕更新啦,来体验下都更新了什么

美股又双叒叕熔断了。   北京时间 19 日 0 时 56 分,标普 500 指数大跌7% 触

bzoj又双叒叕挂了

struts2又双叒叕有漏洞了