七周成为数据分析师05_数据可视化

Posted xingyucn

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了七周成为数据分析师05_数据可视化相关的知识,希望对你有一定的参考价值。

数据可视化之美

数据可视化的目的是为了让数据更高效,让读者可以更高效阅读,而不单是自己使用。

数据可视化首先需要突出数据背后的规律和重要因素,其次才是美观。

数字可视化应该基于实际业务背景,比如地铁线路图并没有按照真实的地理距离来划分,但它却准确直观的传递给用户最关注的重点:应该如何乘车才能到达某地。

 

图表绘制部分主要为实操,这里就不做分享。原课程可以参考如下链接:

如何七周成为数据分析师:Excel技巧之甘特图绘制(项目管理)

 

图表的基本概念

1. 维度和度量

首先需要对维度和度量的概念进行区分。维度表示分析数据的角度/属性,度量则是衡量这个属性的数值大小。

  • 维度 Dimension:描述分析的角度和属性,属于分类数据
    • 如:时间、地理位置、产品类型
  • 度量 measure:具体的参考数值,属于数值数据
    • 如:元、销量、销售额

 

2. 维度主要分为三大类的数据结构:文本(类别)、时间、数值

如:地区分类为文本维度,年份为时间维度,销售额为数值维度

维度之间可以互相转换,如一个人的年龄,本来是时间维度,但可以将其转换为“青年、中年、老年”,转换为文本维度

 

常见的可视化图表

1. 散点图

散点图的优势在于揭示数据间的关系,发觉变量与变量间的关联。

散点图需要至少需要两个维度数据,一列放置于 X 轴,一列放置于 Y 轴

技术图片

 对散点图进行扩展,可以绘制气泡图

区别之处在于气泡图引入了第三个度量,作为气泡的大小

技术图片

 

2. 折线图

折线图常用于观察数据随时间变动的趋势。

此时 X 轴为时间维度,Y 轴为数值维度。

技术图片

对折线图进行拓展,可以绘制面积图

区别之处在于面积图更易于对比各类别间的数据随时间变化的趋势,各类边数据此时是累加显示的。

技术图片

3. 折线图

折线图常用于多个维度的比较和变化。

文本维度/时间维度通常作为X轴。数值型维度作为Y轴。柱形图至少需要一个数值型维度。

技术图片

柱形图还有许多丰富的应用。例如堆积柱形图,瀑布图,横向条形图,横轴正负图等。

技术图片

4. 饼图

饼图优点在于美观,但难以观察各类别间的差距。

技术图片

5. 漏斗图

漏斗图主要反映一个转化流程,便于展示

技术图片

6. 雷达图

也叫蛛网图,它在商务、财务领域应用较大,适合用在固定的框架内表达某种已知的结果。常见于经营状况,财务健康程度。

适用于个体的数据和属性可视化。

 技术图片

 

常见的高级图表

1. 树形图

树形图直观的以面积表示数值,以颜色表示类目。尤其适用于数据量较大类别较多的情况。

技术图片

2. 桑基图

桑基图常用于表达信息的变动和流动状态,是揭示数据复杂变动趋势的图表。

桑基图可以一对多或多对一。如:用户在网页上的活动轨迹。

技术图片

3. 热力图

热力图常用于表现数据在空间上的变化规律。

技术图片

热力图也不一定表示纯粹空间,也可能是属性和维度的规律组合。

如在数据分析中常用热力图表示各特征间的线性关系。

技术图片

4. 关系图

关系图常用于展示不同类别之间的数据关系,展现失误相关性和关联性。

如社交关系链、品牌传播

技术图片

5. 箱线图

箱线图和直方图类似,主要用于统计中,用于观察数据分布情况和对比数据分布

技术图片

6. 标靶图

也称子弹图,常用于衡量 KPI 完成情况

技术图片

7. 词云图

词云图多用于展示,绘制简单

技术图片

8. 地理图

地理图主要体现数据和空间之间的关系

技术图片

 

以上是关于七周成为数据分析师05_数据可视化的主要内容,如果未能解决你的问题,请参考以下文章

七周成为数据分析师04_Excel

七周成为数据分析师01_数据分析思维

七周成为数据分析师07_统计学基础

七周成为数据分析师02_业务分析指标

七周成为数据分析师03_业务分析框架

Python第七周 学习笔记