中文词频统计及词云制作
Posted 14邓金烨
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了中文词频统计及词云制作相关的知识,希望对你有一定的参考价值。
1.中软国际华南区技术总监曾老师还会来上两次课,同学们希望曾老师讲些什么内容?(认真想一想回答)
细说numpy库的使用
2.中文分词
- 下载一中文长篇小说,并转换成UTF-8编码。
- 使用jieba库,进行中文词频统计,输出TOP20的词及出现次数。
输出结果:
Building prefix dict from the default dictionary ... Loading model from cache C:\\Users\\ADMINI~1\\AppData\\Local\\Temp\\jieba.cache Loading model cost 0.723 seconds. Prefix dict has been built succesfully. 人 575 一旦 413 王 375 小孩 286 什么 251 没有 198 一个 155 看着 135 小人 124 他们 113
- **排除一些无意义词、合并同一词。
- **使用wordcloud库绘制一个词云。
(**两项选做,此次作业要求不能雷同。)
以上是关于中文词频统计及词云制作的主要内容,如果未能解决你的问题,请参考以下文章