21种常见大数据可视化图表

Posted bit_kaki

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了21种常见大数据可视化图表相关的知识,希望对你有一定的参考价值。

为什么数据可视化如此重要?
数据可视化能把枯燥的数据变得有趣起来,不用再成千上万的数据面前焦头烂额。
这里小结了下21中常见的图表。附图有的是我从excel生成的,有的是比较懒直接百度找的。

柱状图

最常使用的图表之一
用垂直或水平的柱子表示不同分类数据的数值大小
虽然能展示数据的变化趋势,但这并非它的强项


堆积柱状图

适用于包含若干个小分类的分组数据的可视化
用于比较同一分组内不同分类的数据,或者各组的总量
无法比较不同分组内相同分类的数据
同一组数据分类过多会降低图表易读性


分组柱状图

适用于包含了相同分类的多组数据的比较
可以比较同一分组内不同分类的数据,或不同分组内相同分类的数据
无法对比各分组的总量


正负条形图

使用正反向柱子表示数据的正负数值
适用于有相反含义的数据(例如不同国家的男性与女性的人口数量)
注意的是分界线需为0点


组成瀑布图

用于展示数据的组成,或者增减变化过程
注意相邻浮动列的首尾要在同一水平线上


折线对比图

最常用的图表之一
适用于展示数据的连续变化趋势
注意自变量要有顺序关系(如时间)
注意因变量单位数值对于折线起伏变化的影响
折线过多会降低图表的易读性


层叠面积图

用颜色填充折线与坐标轴之间的区域,以强调数据的变化趋势
注意颜色部分,要是用透明度来区分不同分类数据


河流图

面积图的变形
展示不同类别的数据随时间变化的情况
注意数据可视化是围绕一个变化的中心基线而不是自变量轴


基础饼图

最常用的图表之一
通过扇形的角度大小展示各数据在整体种的占比大小
分类过多时,占比晓得分类数据会难以辨别
在展示区别不大的数据时,饼图的可视化效果会下降


环图

属于中心挖空的饼图
通过环块的角度大小展示各数据在整体中的占比大小


双层环图

属于中心挖空的饼图
双环之间有一层包含关系
适合展示有一层包含关系的数据占比情况


南丁格尔玫瑰图

擅长凸显数据之间的差异,适用于比较大小相近的数值
不适合分类过少的数据(例如一个国家出生和死亡人数)
不适合数值相差过大的数据(例如世界各国人口数)


旭日图

饼图的变形,适用于展示多层级的数据的占比情况
通过环块的角度大小展示各数据在同环数据中的占比大小
相邻的两层数据通常有包含关系,越往外层,分类越细越具体
在数据量很大的是,要借助交互功能才能保持图表的易读性


雷达图

坐标轴始于统一圆心径向排列
同一个分类数据的各项数值点围成一个多边形
擅长展示综合性能和突出异常数据
不适合变量或分类过多的数据


漏斗图

适用于具有逻辑顺序的分类数据的对比(例如看到问卷的人数—进入问卷填写页面的人数—完成问卷的人数—转发问卷的人数)
每个梯形的下底长度则代表该分类数据的数值大小


散点图

通过点的位置展示数据的大小
通过点的分布观察不同分类数据的相关关系
分类数据过多会使点的数量过多,降低图表的易读性


立体气泡图

气泡图是基于散点图的多变量数据可视化形式
气泡的面积大小和颜色均可以表示数值
气泡过多会让气泡难以区分


热力图

热力图通过颜色不同展示不同的数据大小和分布情况
可以没有特定的自变量轴和因变量轴
经常与不同的背景(例如地图)结合


矩形树图

适用于带有权重的层级数据(例如不同省份幼儿教师的学历比例情况)
通过小矩形面积的大小表示其在整体种的占比情况


弦图

数据分布在圆周的节点上
通过节点之间的连线来展示节点的关系
弦的两端宽度可以不相同,以展示权重关系


桑基图

一种描述多级数值流向的流程图
节点的不同长度代表了不同的数值大小
起始流量大小必须一致
不适宜展示带有权重的数值关系





以上是关于21种常见大数据可视化图表的主要内容,如果未能解决你的问题,请参考以下文章

9种方法可视化时间序列变化

33种经典图表类型总结,轻松玩转数据可视化

大数据常见的9种数据分析手段

使用Plotly绘制常见5种动态交互式图表

数据可视化 | 基础图表应用之散点图

使用Plotly绘制常见5种动态交互式图表