Python 自然语言处理字频统计

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Python 自然语言处理字频统计相关的知识,希望对你有一定的参考价值。


import jieba
txt = open("lg.txt", "r", encoding="gb18030").read()

import collections

txt1 = txt
txt1 = txt1.replace(\\n, ) # 删掉换行符
txt1 = txt1.replace(,, ) # 删掉逗号
txt1 = txt1.replace(。, ) # 删掉句号
mylist = list(txt1)
mycount = collections.Counter(mylist)
for key, val in mycount.most_common(10): # 有序(返回前10个)
print(key, val)
38618
了 21157
. 20313
的 15604
不 14958
一 12107
: 11710
来 11405
道 11029
“ 10983


以上是关于Python 自然语言处理字频统计的主要内容,如果未能解决你的问题,请参考以下文章

使用字典在Python中计算字频率效率

python语言是不是允许在一行的末尾加句号?

python批量给word文末添加句号

基于汉字字频特征实现99.99%准确率的新闻文本分类器

Python 自然语言处理

基于汉字字频特征实现99.99%准确率的新闻文本分类器