从文件中统计中文词语出现的频次
Posted 止一
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了从文件中统计中文词语出现的频次相关的知识,希望对你有一定的参考价值。
1 import jieba 2 3 with open(\'红楼梦.txt\', \'r\', encoding=\'utf-8\') as f: 4 txt = f.read() 5 6 ls = jieba.lcut(txt) 7 d = {} 8 for w in ls: 9 d[w] = d.get(w, 0) + 1 10 11 for k in d: 12 if d[k] >= 200 and len(k) >= 2: 13 print(f\'"{k}"出现了"{d[k]}"次\')
以上是关于从文件中统计中文词语出现的频次的主要内容,如果未能解决你的问题,请参考以下文章