Tableau必备知识——谈一谈度量和维度 离散和连续?

Posted 张国荣家的弟弟

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Tableau必备知识——谈一谈度量和维度 离散和连续?相关的知识,希望对你有一定的参考价值。

前言

在我们大家学习tableau初期,都会跟着视频一遍一遍的操作,但是每一次跟着步骤做完图,都要小心翼翼的保存,因为下一次就会不知道怎么来复原了。这是因为咱们需要对tableau基本的概念有一个深刻的意识,掌握好基本的技能是很重要的,进而会节省我们大量的的时间。

在初学的时候可能大家会有这样的疑问:

为什么 我每次做的图无法复现呢?
为什么 我的数据在excel 或者数据库里面好好的,但是在tableau里面字段不能识别?
为什么 看了一下视频教程,别人做的图像,我怎么做不了呢?

哦,其实这个问题的根本原因所在就是咱们对tableau基本知识的理解不够,或者习惯把excel的一些制作逻辑思维来强加在tableau身上,不可否认可视化,聚合,数据透视表这一类的共同的基础概念是相同的。但是核心的架构是不同的,导致了比如都能制作条形图,但是实现的方式各有所异。

tableau 连接数据源,将字段分为维度和度量 ,以及会自动生成一个记录数(所谓的记录数,也是属于度量)。
通过Vizql 技术将我们在tableau界面拖放数据时,每一个操作生成一个查询,该查询随后将转换为vizql语言返回可视化图形。
官方解释:VizQL 是一种用于数据库的可视化查询语言。
咱们先利用下面的条形图看概念,后面在展开来讲解,


注:2019.2.x之前的老版本,还是会有维度,度量名字来区分字段的。
新版本的采用一条线的来(度量名称)来区分,毕竟节省空间,可以多显示几个字段嘛,Tableau UI设计师也考虑到了视觉优化的必要性

tableau字段的货架上(行 列)存在形式是pill,我们习惯的叫为胶囊或者药丸💊,直白一点就是可以拖动的方块,我们叫它字段好了。

字段颜色区别

我们先来看一个问题:
1.为什么在tableau中,字段的颜色,有的是蓝色,有的是绿色?
理由:tableau在读入数据时候,会根据字段是否包含“分类数据”,或者“定量数据”来设置数据字段,也就是所谓的识别“蓝色”和“绿色”。
可能大家会问:哪什么是分类数据?定量数据又是啥?
不急:我们先看一个解释:
分类数据:比如城市名称,用户名字,就是维度
说人话就是维度是定性的,被描述的,不被测量的
维度大多数情况下是离散的
定量数据:比如销售额,利润,订单数量等数值,就是度量
度量大多数情况下是连续的

一句话总结,变蓝》因为是分类数据,tableau自动识别蓝色;变绿》因为是定量数据,tableau自动识别绿色。
题外话:tableau在一些特殊情况下识别的不一定是我们想要的,比如邮政编码,tableau会把它识别成度量,也就是绿色。但是我们都知道邮政编码对我们来说唯一识别性区域的编码,是定性的,这样对于了上面解释的度量大多数情况下是连续的原因。

蓝色和绿色

在视图众各有什么作用?担任着什么样的角色?

二者最大的区别(通常情况下):
维度会创建标题
度量会建立坐标轴

看图说话:
蓝色胶囊生成"标题"

绿色胶囊生成"坐标轴"

百科:坐标轴(coordinate)
axis)用来定义一个坐标系的一组直线或一组线;位于坐标轴上的点的位置由一个坐标值所唯一确定,而其他的坐标轴上的点的位置由一个坐标值所唯一确定,而其他的坐标在此轴上的值是零。

目前为止,建议大家可以一遍阅读,一遍实操一下。下面来做个阶段性的总结:生成标题和生成坐标轴

离散【维度】和连续【度量】

离散字段包含不同的值。它们组成视图中的标题或标签,“胶囊”是蓝色的,大部分的维度是蓝色的(离散的)
连续字段“形成一个不间断的整体”。它们组成视图中的轴,“胶囊”是绿色的,大部分的度量是绿色的(连续的)
准确来说:颜色的作用是来表名这个字段是离散还是连续的

蓝色字段是离散,绿色字段是连续。

这样说是可以的,但是反过来说就不对了,也就是:
是否连续:是通过颜色来判断,是否是维度,不是通过颜色判断的,

绿色可以是维度,也可以是度量
蓝色可以是维度,也可以是度量

它们之间是可以通过我们强制转换的
来我们找一个销售额(绿色)的例子:因为销售额是数字,也就是定量的数据,tableau自动呈现连续的,所以就是绿色,是度量

接下来我们用GIF动图来展示一下离散的状态,猜猜会变成什么?

答案是:从连续的坐标轴变成标题。
哪我们在tableau里面怎么记忆离散和连续呢?
蓝色:象征大海,太广阔了,是分散的(别给我转牛角尖🐂水是连续的哈)
绿色:象征绿灯,绿灯亮,行人连续通行

在具体点来讨论,什么是连续,什么是离散?
离散数据
蓝色字段是离散的,包含了所有有限数量的值,例如,字段:区域,包含动、西,南,北,但没有其他的值。
连续数据
绿色字段是连续的,同盟可以包含一个无限数量的值,例如,一个商品我们可以定价在一个数字区间,理论上价格是可以是任何值的,认为是一个连续的变量。

无论数据集是什么,Tableau 都将自动创建三个字段:

度量名称(维度)
度量值(度量)
记录数(度量)

离散和连续的转换我们可以参考日期字段:
如观察一年当中的11月份平均气温可以把“11月份”当中离散的定性日期部分来处理
如果我们要查看一年导致的总体趋势,采用一个单一,不间断的轴,意味着该日期被用作一个连续的定量值。

以上是关于Tableau必备知识——谈一谈度量和维度 离散和连续?的主要内容,如果未能解决你的问题,请参考以下文章

Tableau基础 维度?度量?

大数据BI工具学习第二期:带你领略tableau 的页面风采

Tableau实战系列Tableau基础概念全解析 -维度和度量

如何在tableau导入地图

如何使用tableau使得数据与地图结合展现

Tableau 参数(控制维度度量排序参考线透视表)