用文本挖掘技术解读2019年政府工作报告

Posted 经济智汇

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了用文本挖掘技术解读2019年政府工作报告相关的知识,希望对你有一定的参考价值。


2019年中国政府工作报告及地方政府工作报告中哪些词出现的频率最高?哪些词一起出现的频率最高?国研网以2019年中国政府工作报告及31个省级政府工作报告为样本,运用R、Gephi进行了文本挖掘与数据可视化展示,下面一起来看看分析结果吧。

用文本挖掘技术解读2019年政府工作报告
2019年中国政府工作报告文本分析

从文本挖掘的分析结果来看,2019年政府工作报告中出现频率最高的10大关键词分别为改革、建设、政策、深化、市场、政府、教育、创新、群众、降低等。

2019年中国政府工作报告词云

用文本挖掘技术解读2019年政府工作报告

用文本挖掘技术解读2019年政府工作报告

通过与2018年中国政府工作报告进行词频共现分析,从高频词词频共现矩阵可以看出,深化市场化改革、加强创新、进行经济建设在两份政府工作报告中出现的频率最高,教育、监管、脱贫也是关注的重点,具有高度的连续性。


2018和2019年中国政府工作报告高频词频共现矩阵

用文本挖掘技术解读2019年政府工作报告


用文本挖掘技术解读2019年政府工作报告

用文本挖掘技术解读2019年政府工作报告

31个地方省级政府工作报告的文本分析


从文本挖掘的分析结果来看,31个省市政府工作报告中排名前50的关键词分别为发展、建设、推进、加快、全面、改革等。

省级政府工作报告词频表

用文本挖掘技术解读2019年政府工作报告

用文本挖掘技术解读2019年政府工作报告



依据分析结果中词频排名前200关键词,
绘制词云如下:



用文本挖掘技术解读2019年政府工作报告

关键词共现分析结果如下。显然,建设与推进共现次数最多,为611次,此外,与建设共现次数较多的关键词依次是发展、加快、加强等,与推进共现次数较多的关键词依次是加快、改革、全面等。

省级政府工作报告词频共现表

用文本挖掘技术解读2019年政府工作报告

用文本挖掘技术解读2019年政府工作报告

我们进一步对关键词进行社会网络分析,结果显示:推进、发展、建设是三个核心关键词。同时,关键词之间聚类分析结果分为三类,分别为,第一类(深化改革方面):推进、持续、深入、全面、深化、改革等;第二类(高质量发展方面):建设、质量、水平、生态、综合、国家、加强等;第三类(经济增长方面):发展、经济、服务、企业、创新、提升、工程、加快等。


省级政府工作报告词频社会网络分析图

用文本挖掘技术解读2019年政府工作报告



完整报告,请点击左下角阅读原文


以上是关于用文本挖掘技术解读2019年政府工作报告的主要内容,如果未能解决你的问题,请参考以下文章

热点报告文本挖掘的视角看政府工作报告

文本挖掘2019年两会政府报告

解读 | 文本挖掘对企业未来潜力无限,行业独角兽浮出水面

R语言文本挖掘+词云显示(jiebaR包+wordcloud2包)

专业解读 | 什么是文本挖掘?

那些年,我们开始学Python网络爬虫与文本挖掘