西游记 词频统计

Posted hrunjie

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了西游记 词频统计相关的知识,希望对你有一定的参考价值。

 1 import jieba
 2 txt=open("D://python_common_exercise//west_journey.txt",r,encoding="utf-8").read()
 3 words=jieba.lcut(txt)   #jieba库函数
 4 count={}    #创建字典
 5 for word in words:
 6     if len(word)==1:
 7         continue
 8     else:
 9         count[word]=count.get(word,0)+1
10 items=list(count.items())   #转换成列表
11 items.sort(key=lambda x:x[-1],reverse=True)
12 for i in range(15):
13     word,count=items[i]
14     print("{0:<10}{1:>5}".format(word,count))

技术图片

 

以上是关于西游记 词频统计的主要内容,如果未能解决你的问题,请参考以下文章

中文词频统计

词频统计单元测试

201671010432词频统计软件项目报告

Spark编程实战-词频统计

Spark编程实战-词频统计

词频统计代码任务总结