7.19 wordcloud库的基本介绍

Posted dadazunzhe

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了7.19 wordcloud库的基本介绍相关的知识,希望对你有一定的参考价值。

7.19 wordcloud库的基本介绍

wordcloud概述

  • 词云以词语为基本单位,更加直观和艺术的展示文本

基本使用

wordcloud库把词云当作一个WordCloud对象

  • wordcloud.WordCloud()代表一个文本对应的词云
  • 可以根据文本中词语出现的频率等参数绘制词云
  • 绘制词云的形状、尺寸和颜色都可以设定

常规方法

  • 以WordCloud对象为基础
  • 配置参数、加载文本、输出文件
方法 描述
w.generate(txt) 向WordCloud对象w中加载文本txt,w.generate("Python and WordCloud")
w.to_file(filename) 将词云输出为图像文件,.png或.jpg?x-oss-process=style/watermark格式,w.to_file("outfile.png")
  • 步骤1:安装库

    pip install wordcloud

    pip install matplotlib

  • 步骤2:配置对象参数
  • 步骤3:加载词云文本
  • 步骤4:输出词云文件

import wordcloud
w = wordcloud.WordCloud()
w.generate("Python and WordCloud")
c.to_file("pywordcloud.png")

配置对象参数

w = wordcloud.WordCloud(<参数>)

参数 描述
width 指定词云对象生成图片的宽度,默认400像素
height 指定词云对象生成图片的高度,默认200像素
min_font_size 指定词云中字体的最小字号,默认4号
max_font_size 指定词云中字体的最大字号,根据高度自动调节
font_step 指定词云中字体字号的步进间隔,默认为1
font_path 指定字体文件的路径,默认None
max_words 指定词云显示的最大单词数量,默认200
stop_words 指定词云的排除词列表,即不显示的单词列表
mask 指定词云形状,默认为长方形,需要引用imread()函数
background_color 指定词云图片的背景颜色,默认为黑色

mask参数详解

指定词云形状,默认为长方形,需要引用imread()函数

  • 步骤1:安装库

    pip install wordcloud

    pip install matplotlib

    pip install scipy
    pip install pillow
    pip install imageio

  • 步骤2:配置对象参数
  • 步骤3:加载词云文本
  • 步骤4:输出词云文件

import wordcloud
from imageio import imread
# 图片指定词云的形状(只能是白色背景的.png图片)
mask = imread(r'C:\\Users\\青柠\\Desktop\\预科\\test1.png')
# 打开指定文件并读取该文件内容,作为词云中的词语
file = open(r'C:\\Users\\青柠\\Desktop\\预科\\第六天\\sanguo','r',encoding='utf-8').read()
w = wordcloud.WordCloud(font_path='rC:\\Windows\\Fonts\\simsun.ttc', mask=mask, width=1000, height=700,background_color="white")
w.generate(file)
w.to_file("pywordcloud.png")

技术图片

以上是关于7.19 wordcloud库的基本介绍的主要内容,如果未能解决你的问题,请参考以下文章

Window10下Python3.7的wordcloud库的安装与基本使用

wordcloud绘制词云彩

Python—— 文件和数据格式化(模块6: wordcloud库的使用)(实例:自动轨迹绘制&政府工作报告词云)

WordCloud

python基础篇-wordcloud库的使用

7.5 Python 模块6-wordcloud库的使用