jiaba库的使用《活着》字频分析

Posted wangyingjie123

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了jiaba库的使用《活着》字频分析相关的知识,希望对你有一定的参考价值。

import jieba
txt = open("huozhe.txt", "r", encoding="utf-8").read()
words = jieba.lcut(txt)
counts = {}
for word in words:
    if len(word) == 1:
        continue
    else:
        rword = word
    counts[rword] = counts.get(rword,0) + 1 
items = list(counts.items())
items.sort(key=lambda x:x[1], reverse=True) 
for i in range(10):
    word, count = items[i]
    print("{0:<10}{1:>5}".format(word, count))

技术图片

以上是关于jiaba库的使用《活着》字频分析的主要内容,如果未能解决你的问题,请参考以下文章

基于汉字字频特征实现99.99%准确率的新闻文本分类器

《活着》片段

基于汉字字频特征实现99.99%准确率的新闻文本分类器

基于汉字字频特征实现99.99%准确率的新闻文本分类器

使用字典在Python中计算字频率效率

javascript 字频#js