Tableau基础 维度?度量?

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Tableau基础 维度?度量?相关的知识,希望对你有一定的参考价值。

参考技术A 在学习tableau的初期,我想大多数同学,一方面惊叹于tableau能做出绚丽的图表,而另外一个方面,也几乎都是在猜测tableau会做出什么样子的结果。换句话说,有的时候,你不知道如何复制上一次的成功。

我最的感受呢,就是做出一张好看的图,就小心翼翼的保存,因为下次再想做很可能就无法重现,整个人是悲剧的。

工作中,你可能还会经常遇到这种情况,往往是想要通过tableau实现已经存在的某种图表(无论是excel的样例,还是别处的样图)比如下图:

此处应该有知乎体:

但是毕竟,tableau和excel的实现基础是有区别,以至于经过会被黑说

excel很容易做出,为什么tableau这么复杂,MDZZ!究其原因,数据结构的不规整、字段设置和使用方式不正确,都是导致做图遇到障碍的原因。而这些都是所谓的基础知识。所以,掌握好基本的技能,是很重要的,其实也是节省时间的。

来归纳一下吐槽有哪些:

呐,本文不是来回答这几个问题,我说了,基础很重要,这篇文章谈的是,理清楚最最最基本的维度和度量在此基础上进行扩展。(因为我发现很多人急急忙忙的在研究“数据预测”,然而基本的数据结构还未搞懂)

问题来了,怎么才能最舒服的推进文章的章节?我想,可能是通过提问的方式吧。(我也不打算拦着你去快进直接看后边的)

问题如下:

这是我们贯穿全文的问题,全文会按照如下顺序一步步推进:

好的,前戏结束,现在进入正题

先来看图,如下的图是一个最典型的tableau视图,可以看到,蓝色和绿色箭头的标记

tableau中的字段的存在形式,英文叫做pill,直译为药丸,其实就是个可拖动的方块,我们可以叫做字段好了。

理由如下:

上边这句话是官方解释,那么,啥是分类数据?啥是定量数据?

再来一个官方的解释:

说人话就是:

注意!!!这么说肯定是不完备的,是错的,但是初始阶段,你就这么认为,也没问题,因为后边会讲为什么是错误的。

再来举个栗子,一个学校的成绩表,涉及的统计字段有:

那么:

(题外话,举一些身边的例子更能帮助理解,不要在理解阶段就拿营销数据出来,脑子会乱)

这是关于维度和度量的最初认识,现在知道了为啥会变蓝和变绿

下面进行下一步,两种字段在视图中的区别。那么来试一下,两种字段在视图有啥区别?

二者最大的区别是,通常情况下,将数据字段拖入视图中时:

请注意,是通常情况下,但不全部都是如此。

看图说话,这个是蓝色方块生成的“标题”

这个是绿色方块生成的“坐标轴”(如果你不懂什么是轴,什么是标题,我就帮不了你了)

目前为止,知道了为什么是这个颜色,以及这个颜色会有什么后果,好的,你已经学会一半了,厉害吧!下面来做个阶段性总结

作用就是,生成标题,和生成坐标轴

上一节说的是“通常情况下”,这里来说说非通常情况!

关于维度和度量,上边问题的说法是对的,但不完全对。也就是说:

注意,是“大部分”的,并不是全部

准确答案应该是:

这样说是ok的,但是反过来说就是不对的。也就是说:

是不是有点晕?别急,这就来举栗子了

找一个绿色的例子:销售额,因为额度肯定都是数字,也就是定量数据,呈连续,所以就是绿色,是度量

而在实施聚合后,比如sum,就会变为蓝色的不连续

怎么记忆呢

再具体点,什么是连续,什么是离散?

离散数据

连续数据

注意, 在离散和连续的区分中有许多灰色区域。在上面给出的例子中,一个项目的不可能存在于一个无限的可能值集合。我们只是理论上认为,价格可以在任何值,认为是一个连续变量。

如果我们想给所有的字段分各类,怎么做?

对于一个字段的完整分类,可不是仅仅有一个指标---是否连续,还有一个重要指标---聚合,先抛出这张表:

这一节就是要解释:

按照上一节我们聊的,连续和离散两个因素来区分,把该表格竖着看:

对于Continuous,也就是连续,分为维度和聚合

对于Discrete,也就是离散,也是分为维度和聚合

用非连续数据(蓝色)举例

栗子来了,比如9个数字,为集合a:

聚合目的,是使用一个单一数字去表征这一群数字,比如:

第一节说过,离散字段总是为视图添加标题,而连续字段则为视图添加坐标轴。

牢记这种区别,可以帮助你清楚的了解作图的意图。

栗子来了,回到四象限图,使用销售额“”这个字段来模拟研究4个象限的4种状态:

怎么区分?别忘了第一节就说的

那么是否聚合呢?就看,是否是一个点

(这里也可能是LOD详细级别的层级不同)

下面开始来实际操作一下这几个东西

创建Viz视图时,离散和连续的处理方式,是完全不同的。还记得的上边提到的问题么?

而了解了这些区别后,你才能清楚的制定构建一个视图的基本组成是什么

在执行具体操作前,要先聊一下可视化的基础,也可以说是视觉通道基础。

视觉的传达目的是服务快速识别特殊数据,主要有这几种形式:(看下图主要涉及这几条)

对于面积、长度、大小等,可以归纳为同一类,且纹理在快速视觉传达不是很合适,则变为:

那么,再来简单介绍tableau界面

对应着下图中tableau几个操作的地方

而在tabelau中,就是标记面板的功能实现可视化操作的:

按照1、2、3的顺序,先来说不同类型字段在“行”“列”中的区别:

第一节说过,主要的区别是,维度生成标题,度量生成坐标轴

先看 非连续 也就是 蓝色

然后在看绿色 连续

先来看看蓝色的(非连续)字段

一个蓝色字段-行

当你添加一个蓝色的字段,不论是行,或列,tableau在行/列出会显示该字段的head

下图蓝色框的,就是所谓的tableau head,第一节中说的标题

多个蓝色字段-行

先占坑

待补全

多个蓝色字段-列

先占坑

待补全

多个蓝色字段-行列组合

之前都是只插一个,我们来多插入几个试试,这里呢,又拖入了两个蓝色的字段。其中,两个列,一个行,最终形成如下样子的列表。

一个绿色字段-行

再来看看绿色:

当你添加一个绿色的字段,tableau在行/列出会显示该字段的坐标轴

换句话说,每个行或列会出现一个对应的轴,就是第一节说的坐标轴

多个绿色字段-行

再来近一步,我们拖入多个绿色药丸pill,放在“行”

变成这样了

多个绿色字段-列

放在列呢?

多个绿色字段-行列组合

行列组合一起呢?先推测一下,肯定是,左边和下边

先占坑

就是这样咯,这就是两个绿色连续构成的图形

例如,散点图通常是一个有两个轴,一个垂直和一个水平的视图。

用刚才了解到的信息,该视图有2个轴,那么肯定需要在行和列各有一个绿色。

2016-12-3 发布

<未完待续>

Peace!

Tableau实战系列Tableau基础概念全解析 -维度和度量

前言

连接到新数据源时,Tableau 会将该数据源中的每个字段分配为 “数据”窗格的维度或度量,具体情况视字段包含的数据类型而定。你使用这些字段来构建数据的视图。

以下是我为大家准备的几个精品专栏,喜欢的小伙伴可自行订阅,你的支持就是我不断更新的动力哟!

MATLAB-30天带你从入门到精通

MATLAB深入理解高级教程(附源码)

tableau可视化数据分析高级教程

1.关于数据字段角色和类型

数据字段由数据源中的列组成。系统会为每个字段自动分配一种数据类型( 例如整数、字符串、日期) 和一个角色:离散维度或连续度量( 较常见) ,或者连续维度或离散度量( 不太常 见) 。

     维度包含定量值( 例如名称、日期或地理数据) 。你可以使用维度进行分类、分段以及 揭示数据中的详细信息。维度影响视图中的详细级别。

     度量包含可以测量的数字定量值。度量可以聚合。将度量拖到视图中时,Tableau( 默 认情况下) 会向该度量应用一个聚合。

1.1蓝色字段与绿色字段

Tableau 在视图中以不同的方式表示数据,具体取决于字段是离散字段( 蓝色) 还是连续字 段( 绿色) 。连续和离散是数学术语。连续意指“构成一个不间断的整体,没有中断”;离散意 指“各自分离且不同”。

绿色度量 和维度 是连续的。连续字段 值被视为无限范围。通常,连续字段会向视图中添加轴。

蓝色度量 和维度 是离散的。离散值被 视为有限。通常,离散字段会向视图中添加标题。

1.2Tableau 中可能的字段组合

下表显示了不同的字段在视图中的外观示例。人们有时将这些字段称为“胶囊”,但我们在

Tableau 帮助文档中将其称为“字段”。

 

注意:对于多维数据集( 多维) 数据源,用于更改数据角色的选项受到限制。在

Tableau Desktop 中,多维数据集仅在 Windows 上受支持。可以将某些度量从连续

更改为离散,但通常无法更改多维数据集数据源中字段的数据角色。

可帮助你了解字段何时为度量的一个视觉提示是字段是使用函数聚合的,这一点使用字段 名中的一个聚合缩写指明

   如果解聚整个视图,则不会根据定义来聚合视图中的字段。

   如果你使用的是多维数据源,则在数据源中聚合字段,但视图中的字段不显示该聚合。

注意:可以为字段设置默认聚合以及其他属性和设置。

2.视图中使用的连续和离散字段的示例

 在( 下面) 左侧的示例中,由于“Quantity”( 数量) 字段设置为“连续”,因此它将沿视图的底部 创建一个水平轴。绿色的背景和轴让你可以看到它是连续字段。

在右侧的示例中,“Quantity”( 数量) 字段已设置为“离散”。它将创建水平标题,而不是轴。蓝 色的背景和水平标题让你可以看到它是离散字段。

 

在两个示例中,“Sales”( 销售额) 字段都设置为“连续”。该字段将创建一个垂直轴,因为它是 连续字段并且已添加到“行”功能区。如果它位于“列”功能区上,则会创建水平轴。绿色的背 景和聚合函数( 在本例中为 SUM) 帮助指明它是度量。

“Quantity”( 数量) 字段名称中没有聚合函数,则表明它是维度。

3.视图中的维度字段

当你将离散维度字段拖到“行”或“列”时,Tableau 将创建列或行标题。

 

在许多情况下,“维度”区域的字段在添加到视图时一开始将为离散,带有蓝色背景。日期维 度和数值维度可能为离散维度或连续维度,所有度量都可能为离散度量或连续度量。

将维度拖到“行”或“列”时,只需通过单击字段并选择“度量”便可将字段更改为度量。现在,

视图将包含一个连续轴( 而不是列或行标题) ,并且字段的背景将变为绿色:

 

日期维度可能为离散维度或连续维度。包含字符串或布尔值的维度不能是连续维度。

Tableau 不会对维度进行聚合。

在 Tableau 查询中,视图中的维度的 SQL 表示形式为“Group By”子句。

4.维度会对视图中的详细级别产生怎样的影响

视图中的详细级别是指视图中维度和度量数据的数据粒度。

将维度添加到“行”或“列”时,视图中标记的数量会增加。

若要了解为何添加维度会增加视图中标记的数量,请执行以下操作:

1. 将“Segment”( 细分市场) 拖到“列”。

Tableau 窗口底部的状态栏显示视图中现在有三个标记:

 

这些标记只包含占位符文本 Abc,因为你此时只构建了视图的结构。

2. 将“Region”( 区域) 拖到“列”。 现在有 12 个标记。“Segment”( 细分市场) 中的三个值乘以“Region”( 区域) 中的四 个值,结果为 12。

3. 将“[Ship Date]”( [发货日期]) 拖到“行”。 现在共有 57 个标记( 三个细分市场乘以四个区域,再乘以五年,结果为 60,但视图中 有三个在数据源中没有数据的维度组合) 。 我们可继续向“行”和“列”中添加维度,并观察到标记的总数持续增加。将维度拖到 “标记”卡上的一个位置( 例如“颜色”或“大小”) 将也会增加标记的数量,但不会增加视 图中标题的数量。向视图中添加维度来增加标记数量的过程称为设置详细级别。 将维度添加到 Tableau 中的以下任何位置会对详细级别产生影响:

 

4. 视图现在包含 57 个单独的 Abc 实例 — 视图都是结构,没有内容。通过将“Sales”( 销 售额) 拖到到“文本”来调整这一点。现在可以认为视图是完整的:

 

说明:

某些情况下,向视图中添加度量可能会增加视图中标记的数量。举例来说,如果将

“Sales”( 销售额) 放在上面视图中的“行”上,标记的数量将为 57。但如果随后也将

“Profit”( 利润) 放在“行”上,标记的数量将增加到 114。但这与更改视图的详细级别不

同。

   视图中标记的数量并不保证会与你将组成详细级别的每个维度中的维度值数量相乘 所得到的数量对应。标记数量可能较低的原因有多种。若要将此视图中标记的数量从

57 增加到上面视图中的 60,请右键单击( 在 Mac 上按住 Control 单击) 视图中的日期 标题之一以及日期或数据桶标题,并选择“显示缺失值”。

 

5.视图中的度量字段

将度量拖到视图上时,默认情况下系统会对其进行聚合。聚合的类型因视图类型而异。你应 始终检查聚合并在必要时进行更改。

当你将连续字段从“数据”窗格拖到“行”或“列”时,Tableau 将为该字段创建一个连续轴。

 

如果单击字段并将其更改为“离散”,值将变为列标题

 

Tableau 会继续对字段的值进行聚合,因为即使该字段现在为离散,但它仍然是度量,而

Tableau 默认情况下会对度量进行聚合。

在 Tableau 可能由于数据类型的原因而将字段错误分类为维度或度量的情况下,你可以对其 进行转换并更改其角色。如果度量包含不需要聚合的数字( 例如包含日期值的字段) ,你可能 需要将其转换为维度。

6.连续和离散字段如何更改视图

连续和离散是数学术语。连续意指“构成一个不间断的整体,没有中断”;离散意指“各自分离 且不同”。 在 Tableau 中,字段可以为连续或离散。当你将字段从“数据”窗格拖到“列”或“行”时,值默 认情况下将是连续的,并且 Tableau 将创建轴。当你将字段从“数据”窗格拖到“列”或“行”

时,值默认情况下将是离散的,并且 Tableau 将创建列或行标题。

6.1连续字段生成轴

如果字段包含可以加总、求平均值或以其他方式聚合的数字,则会在你第一次连接到数据源 时添加该字段作为“数据”窗格中的度量字段。Tableau 假定这些值是连续的。

当你将连续字段拖到“行”或“列”上时,Tableau 会显示一个轴。轴是一个显示最小值和最大 值之间的值的度量线。标尺和模拟温度计是显示轴的物品的例子。

Tableau 必须能够显示一系列实际值和可能值,因为除了数据源中的初始值之外,你在视图 中处理连续字段时始终可能会出现新值。

尽管连续轴上有值标签( 下图中的 0、0.5、...3.0) ,但实际标记不必像与列标题对齐一样与 这些标签对齐。例如,在下图中,蓝色条形实际上延伸到了水平轴上的值 6.940,而不是确 切地延伸到 7.0。

 

连续字段的可能值的数量无法预计。举例来说,如果有一个名为“Rating”( 评级) 的字段,

并且初始值为 1、3、3.5、3.6 和 4,即五个离散值。但如果你将“Ratings”( 评级) 放在“行”

上,Tableau 会自动以 SUM 的形式聚合该值( 你随后会立即将其更改为 AVG,因为与将等 级加总相比,对等级求平均值更有逻辑) ,而这样会随后创建第六个值 (3.02),在你向视图 中添加字段之前,该值并不存在。并且,如果你随后应用了排除两个初始值的筛选器,平均 值也将更改,该值也将是另一个值。然后你更改了聚合,...你就明白了。可能值的数量即使 不是无限,也肯定是巨大的。

字段包含数字的事实并不必然表明这些值是连续的。邮政编码就是很经典的例子:尽管邮 政编码通常完全由数字组成,但它们实际是应该不会加总或求平均值的字符串值。如果

Tableau 将此类字段作为度量分配给“数据”窗格,则应将其拖到维度区域以将其更改为维 度字段。

6.2离散字段创建标题

如果某个字段包含的值是名称、日期或地理位置( 不是数字的任何内容) ,则会在你第一次 连接到数据源时添加该字段作为“数据”窗格的维度。Tableau 将值视为离散。

当你将离散字段拖到“列”或“行”上时,Tableau 会创建标题。离散字段的单独值将成为行或 列标题。由于绝不会对这些类型的值进行聚合,因此在你处理视图时不会创建新字段值,因 此就不需要轴

6.3筛选器上的离散字段与连续字段

当你将离散字段拖到“筛选器”功能区上时,Tableau 将提示你选择应在视图中包括离 散字段的哪些“成员”。

 

将“日期”字段放在“筛选器”上时,结果可能为离散筛选器或连续筛选器。

当你将连续度量放在“筛选器”上时,Tableau 将首先提示你为筛选器选择聚合,然后提 示你指定要如何对连续的值范围进行筛选。

当你将连续维度放在“筛选器”( 而不是“日期”) 上时,Tableau 将提示你指定要如何对6.4连 续的值范围进行筛选。

颜色上的离散字段与连续字段 当你将离散字段拖到“标记”卡中的“颜色”上时,Tableau 将显示一个分类调色板,并为字段的 每个值分配一种颜色。

当你将连续字段放在“颜色”上时,Tableau 将显示一个具有连续颜色范围的定量图例。

以上是关于Tableau基础 维度?度量?的主要内容,如果未能解决你的问题,请参考以下文章

如何在tableau导入地图

Tableau必备知识——谈一谈度量和维度 离散和连续?

Tableau可视化分析实战系列Tableau基础概念全解析 -数据结构及字段

如何使用tableau使得数据与地图结合展现

Tableau 参数(控制维度度量排序参考线透视表)

Tableau 参数(控制维度度量排序参考线透视表)