词云分析之英文

Posted pandaboy1123

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了词云分析之英文相关的知识,希望对你有一定的参考价值。

技术分享图片

from pyecharts import WordCloud
import jieba
import re
import nltk


with open(r‘F:算法othersmerry.txt‘, ‘r‘, encoding=‘utf-8‘) as f:
    text = f.readlines()
    word_list = []
    word_dic = {}
    for line in text:
        if re.findall(‘([a-zA-Z])‘, line.strip()):
            result = "".join(i for i in line.strip() if ord(i) < 256)
            from nltk.tokenize import WordPunctTokenizer
            words = WordPunctTokenizer().tokenize(result)
            for w in words:
                if 97 <= ord(w.lower()[0]) <= 122:
                    word_list.append(w)
    # print(word_list)
    set_word_list = list(set(word_list))
    for set_word in set_word_list:
        word_dic[set_word] = word_list.count(set_word)
    # print(word_dic)
name = []
value = []
for k,v in word_dic.items():
    name.append(k)
    value.append(int(v)*100)
wordcloud = WordCloud(width=1300, height=620)
wordcloud.add("", name, value, word_size_range=[20, 100],shape=‘pentagon‘)
wordcloud.render(‘test.html‘)

  

以上是关于词云分析之英文的主要内容,如果未能解决你的问题,请参考以下文章

[python] 词云:wordcloud包的安装使用原理(源码分析)中文词云生成代码重写

红楼梦词云分析

词云分析《天龙八部》人物出现次数

python实战B站弹幕是如何看待“法外狂徒张三”的?词云分析

大数据分析:微信推文爬取与分析(词频词云分析)

预定热榜!!!用python分析taptap游戏评价,生成词云,源码赠送,评论送书包邮