小白学 Python 数据分析(15):数据可视化概述
Posted 极客挖掘机
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了小白学 Python 数据分析(15):数据可视化概述相关的知识,希望对你有一定的参考价值。
人生苦短,我用 Python
前文传送门:
小白学 Python 数据分析(2):Pandas (一)概述
小白学 Python 数据分析(3):Pandas (二)数据结构 Series
小白学 Python 数据分析(4):Pandas (三)数据结构 DataFrame
小白学 Python 数据分析(5):Pandas (四)基础操作(1)查看数据
小白学 Python 数据分析(6):Pandas (五)基础操作(2)数据选择
小白学 Python 数据分析(7):Pandas (六)数据导入
小白学 Python 数据分析(8):Pandas (七)数据预处理
小白学 Python 数据分析(9):Pandas (八)数据预处理(2)
小白学 Python 数据分析(10):Pandas (九)数据运算
小白学 Python 数据分析(11):Pandas (十)数据分组
小白学 Python 数据分析(12):Pandas (十一)数据透视表(pivot_table)
小白学 Python 数据分析(13):Pandas (十二)数据表拼接
小白学 Python 数据分析(14):Pandas (十三)数据导出
引言
从本篇开始,整个系列进入到第二部分,数据可视化。
那么,什么是数据可视化?
可以看下下面这个动图,动图来源阿里云官网( https://data.aliyun.com/visual/datav )。
可以看到,这个动图非常的炫,那我们是不是学了数据可视化以后就能做出来这种效果。
emmmmmmmmmmmm。。。。。。。。
这个难度有点高,打怪升级也没有直接出门打 BOSS 的打法撒。
工欲善其事必先利其器
我们先看下现在使用的主流数据可视化的工具(类库)有什么。
Matplotlib
第一个当然是我们在前面开篇中介绍过的 Matplotlib , Python 数据分析经典三件套之一。
首先还是几个官方网址罗列一下,防止有的同学找不到:
GitHub:https://github.com/matplotlib/matplotlib
官网:https://www.matplotlib.org/
中文网:https://www.matplotlib.org.cn/
Matplotlib 的安装过程还是十分简单的:
pip install matplotlib
等待进度条走完,我们就算安装完成了。
在学习怎么使用 matplotlib 之前,我们可以先看下 matplotlib 的一些示例:
错了错了,这么复杂的图我怎么可能画的出来。。。
下面这种才是我们的目标:
pyecharts
在除了可以使用 Matplotlib 作为数据可视化的工具之余,我们还可以选择 pyecharts 作为数据可视化工具。
先做一个简单的简介,以下内容来自官方文档:
Echarts 是一个由百度开源的数据可视化,凭借着良好的交互性,精巧的图表设计,得到了众多开发者的认可。而 Python 是一门富有表达力的语言,很适合用于数据处理。当数据分析遇上数据可视化时,pyecharts 诞生了。
相信很多同学对 Echarts 并不陌生,在做页面图表的时候,能选择的第三方支持库并不多,而 Echarts 是其中做的相当不错的一个类库,毕竟背后是由百度开源的。
放几个官方的链接:
GitHub:https://github.com/pyecharts/pyecharts
接下来还是看如何安装:
pip install pyecharts
和前面安装 Matplotlib 一样,静静的等待进度条走完就行。
这里有关版本有一点需要注意,不管是使用 Matplotlib 还是使用 pyecharts ,都需要 Python 的版本是 3.x ,在官方文档中都已经注明 2.x 不再进行维护。
至于小编为什么要介绍 pyecharts 呢?给大家看几个官方的示例:
是不是感觉单纯的从 UI 设计的角度上来讲, pyecharts 要比 Matplotlib 要好看的多,感觉 Matplotlib 像是上个世纪的产物。
在接下来的内容中,小编会先分享 Matplotlib 的使用,之后会专门写几篇介绍下 pyecharts 的使用。
数据可视化的基本流程
第一步:整理数据
数据还是数据可视化的基础,在所有的事情开始之前,需要先明确需要把哪些数据图表化。
第二步:明确目的
在上一步中,我们拿到了需要图表化的数据,接着就需要想清楚,我们展示这些数据到底是为了什么,是要表达一种趋势,还是要展现对比等等。
第三步:选择图表形式
在明确了我们的目的之后,就需要选择展现这些数据的形式了,我们需要为这些数据选择合适的展现形式,这就需要分情况讨论了。
例如我们想要展现一种趋势,那么折线图就要比柱状图更为合适,如果是需要展现对比,那么柱状图就要比折线图合适,还有是展现百分比,那么我们选择饼状图就会更为合适。
本篇的内容就到这里了,下一篇,我们接着介绍 Matplotlib 的使用姿势。
以上是关于小白学 Python 数据分析(15):数据可视化概述的主要内容,如果未能解决你的问题,请参考以下文章
小白学数据神经网络第二弹:Google可视化体验平台Tensorflow Playground