综合练习:词频统计

Posted 悦动

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了综合练习:词频统计相关的知识,希望对你有一定的参考价值。

#读取英文歌词文件
file=open(dd.txt,r,encoding=utf-8)
word=file.read()
file.close()
#排除符号
di=‘‘‘.,‘‘""?!:;‘‘‘
for i in di:
    word=word.replace(i,‘‘)
#大写转换小写 空格分割
word=word.lower().split()
#定义字典存放数据
diet={}
for c in word:
    count=word.count(c)
    diet[c]=count
for c in diet:
    print(diet[c],c)
#排除介词等无关词语
de={the,and,i,in,to,in,with,it}
for i in de:
    diet.pop(i)
#排序
count = sorted(diet.items(),key=lambda items: items[1], reverse=True)
#将结果存放在文件夹
f=open("F:text.txt",w)
for i in range(20):
    f.write(count[i][0]+" "+str(count[i][1] )+\n)
f.close()

 

以上是关于综合练习:词频统计的主要内容,如果未能解决你的问题,请参考以下文章

综合练习:词频统计

综合练习:词频统计

综合练习:英文词频统计

综合练习:英文词频统计

综合练习:词频统计

综合练习:英文词频统计