从文件中统计中文词语出现的频次

Posted 止一

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了从文件中统计中文词语出现的频次相关的知识,希望对你有一定的参考价值。

 1 import jieba
 2 
 3 with open(\'红楼梦.txt\', \'r\', encoding=\'utf-8\') as f:
 4     txt = f.read()
 5 
 6 ls = jieba.lcut(txt)
 7 d = {}
 8 for w in ls:
 9     d[w] = d.get(w, 0) + 1
10 
11 for k in d:
12     if d[k] >= 200 and len(k) >= 2:
13         print(f\'"{k}"出现了"{d[k]}"次\')

 

以上是关于从文件中统计中文词语出现的频次的主要内容,如果未能解决你的问题,请参考以下文章

请大神指导从大日志文件中统计关键字次数的办法

linux中统计文件中一个字符串出现的次数

从列中统计 7 和 0 出现的次数

EXCEL中统计某个区域内多个数字一共出现的次数

从日志文件中统计给定时间段内的唯一用户数

从客户购买/收听行为中统计“相似产品/音乐/...”的工作原理是啥?