对采集的游记进行数据分析

Posted qqzj

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了对采集的游记进行数据分析相关的知识,希望对你有一定的参考价值。

使用jieba模块对内容进行处理,在tfidf.py源码中加入一些自定义的停用词,然后将生成的列表词组使用WordCloud展示出来

 

from jieba import analyse
# 引入TF-IDF关键词抽取接口
tfidf = analyse.extract_tags

import matplotlib.pyplot as plt
from wordcloud import WordCloud,STOPWORDS,ImageColorGenerator
import jieba
from scipy.misc import imread
d = os.path.dirname(__file__)
font = r‘C:WindowsFonts0CAB71B.007.ttf‘

技术图片 

对游记中出现的地名统计发现:

技术图片

 

 在地图中的位置如下:

技术图片

以上是关于对采集的游记进行数据分析的主要内容,如果未能解决你的问题,请参考以下文章

[ptyhon] 日志采集分析示例

python装饰器实现对异常代码出现进行监控

如何用MapReduce程序对采集到的数据进行预处理?

Java 性能数据采集利器

学习爬虫:《Python网络数据采集》中英文PDF+代码

如何对美团网商家数据进行采集或爬虫