python 根据链家爬取的信息生成云词

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了python 根据链家爬取的信息生成云词相关的知识,希望对你有一定的参考价值。

#-*- coding: utf-8 -*-
‘‘‘
Created on 2017-10-12

@author: wbhuangzhiqiang
‘‘‘
import csv
from wordcloud import WordCloud#云词模块
import matplotlib.pyplot as plt#展示
#将链家爬取的数据
with open(D:\\\\PycharmProjects\\\\HZQTEST\\\\爬虫\\\\house.csv,r) as  vscfile:
    reads =csv.reader(vscfile)
    lst = []
    for  read  in reads:
        for i in read:
            lst.append(i)
mess =str(lst)
cloud = WordCloud(
    #设置字体,不指定就会出现乱码
    font_path=D:\\\\PycharmProjects\\\\HZQTEST\\\\zi.ttf,
    #设置背景色
    background_color=white,
    #允许最大词汇
    max_words=2000,
    #最大号字体
    max_font_size=40
    )
word_cloud = cloud.generate(mess) # 产生词云
plt.imshow(word_cloud)
plt.axis(off)
plt.show()

云词展示效果:

技术分享

 

以上是关于python 根据链家爬取的信息生成云词的主要内容,如果未能解决你的问题,请参考以下文章

爬虫练习三:爬取链家二手房信息

利用pandas对在链家网爬取的租房数据进行清洗

python 爬取链家二手房信息

Python的scrapy之爬取链家网房价信息并保存到本地

python 学习 - 爬虫入门练习 爬取链家网二手房信息

Python爬虫可以爬取啥