从文件中统计中文词语出现的频次

Posted 止一

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了从文件中统计中文词语出现的频次相关的知识,希望对你有一定的参考价值。

 1 import jieba
 2 
 3 with open(\'红楼梦.txt\', \'r\', encoding=\'utf-8\') as f:
 4     txt = f.read()
 5 
 6 ls = jieba.lcut(txt)
 7 d = {}
 8 for w in ls:
 9     d[w] = d.get(w, 0) + 1
10 
11 for k in d:
12     if d[k] >= 200 and len(k) >= 2:
13         print(f\'"{k}"出现了"{d[k]}"次\')

 

以上是关于从文件中统计中文词语出现的频次的主要内容,如果未能解决你的问题,请参考以下文章