统计一篇英文文章内每个单词出现频率,并返回出现频率最高的前10个单词及其出现次数

Posted jiangshanduojiao

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了统计一篇英文文章内每个单词出现频率,并返回出现频率最高的前10个单词及其出现次数相关的知识,希望对你有一定的参考价值。

统计一篇英文文章内每个单词出现频率,并返回出现频率最高的前10个单词及其出现次数
from collections import Counter
import re

with open(a.txt, r, encoding=utf-8) as f:
    txt = f.read()
c = Counter(re.split(W+,txt))  #取出每个单词出现的个数
print(c)
ret = c.most_common(10)   #取出频率最高的前10个
print(ret)

 

以上是关于统计一篇英文文章内每个单词出现频率,并返回出现频率最高的前10个单词及其出现次数的主要内容,如果未能解决你的问题,请参考以下文章

统计一段文章的单词频率,取出频率最高的5个单词和个数(python)

Linux作业-shell统计某文章中出现频率最高的N个单词并排序输出出现次数

如何用python统计单词的频率

TF-IDF(词频-逆文档频率)介绍

单词统计

哈夫曼树——按字符出现频率自动编码