大数据分析-零基础学Tableau+超详细讲解+示例练习
Posted 你隔壁的小王
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了大数据分析-零基础学Tableau+超详细讲解+示例练习相关的知识,希望对你有一定的参考价值。
目录
Tableau简介及工作界面介绍
- TTableau公司将数据运算与美观的图表完美地嫁接在一起。它的程序很容易上手,可以用它将大量数据拖放到数字“画布”上,转眼间就能创建好各种图表。这一软件的理念是,界面上的数据越容易操控,公司对自己在所在业务领域里的所作所为到底是正确还是错误,就能了解得越透彻。
-
导入数据一般分为两种,第一种从本地导入,第二种从服务器导入,在这里我们可以导入我们需要的数据,如果是Excel文件直接点第一个导入即可,CSV文件点击文本文件导入即可
-
导入数据后会自动跳转到数据源界面, 这里是我们导入的数据源,如果我们导入了多个数据可以在连接处进行选择,工作表是你这个表格有多少个sheet页,他会在这里展示出来
-
Tableau最突出的特色就是拖放, 我们可以通过拖动表格来建立关系,可以看到目前显示该表格一共有396行,行默认设置最大是1000行,在Tableau中如果你的数据文件中有一列未命名的话,他会自动命名为F1,
-
其中abc表示字符串,一连串的字符、#代表数字类型,数字才可以进行计算
-
上边都是维度数据,下边是度量数据,维度代表的是类别,两者类型不同
-
筛选器可以选择你需要的数据,点击颜色更改图形颜色,标签是数据显示在图形中
-
列功能区对应的是横轴,行功能区对应的是纵轴
Tableau条形图绘制
条形图1:各地区酒店数量
如果想要绘制各地区酒店数量的直方图那么,肯定要导入酒店数据和地区两列字段,
生成的图片如图所示,可以观察到有些字迹显示不全,对于这种情况我们可以通过调整其显示方式,选择整个视图,调整其显示大小,为了更好的展示将其调整为降序排列
如下图所示,各地区酒店柱状图生成
条形图2:各地区酒店均价
因为我们要求得是价格的平均值,所以需要将价格筛选为平均值
可以看到中西区的酒店价格平均最高
堆积图:价格等级堆积图‘
堆积条形图是一种特殊的条形图,通过不同的色块来表示不同种类有多少,如何来构建堆积条形图,主要是看你想堆积的对象是什么
可以看到中西区的高档酒店是最多的,条形图多用来比较大小,而堆积图则是看每一样有哪几种、由哪些构成
Tableau直方图绘制
- 直方图(Histogram),又称质量分布图,主要是用来呈现数据的分布情况,是一种统计报告图,由一系列高度不等的纵向条纹或线段表示数据分布的情况。 一般用横轴表示数据类型,纵轴表示分布情况。
- 直方图在Tableau中绘制时要首先设置数据桶
- 我们可以根据我们自己的需要来设置数据桶,也可以设置为建议的大小,设置好数据桶之后,其他的操作就和条形图一致了
示例
绘制各国家电影数量条形图(按此命名工作表),要求为横向条形图,按照升序排列,条形图顶部要有标签(要全部显示),选择整个视图将图表充满整个视图区,并给出分析结论;
从图中可以发现,在1888年到2016年之间,总计共有电影38737部,其中头部电影地区主要在美国、中国、日本,符合长尾分布,以美国电影数量最多
创建电影评分的直方图(按此命名),数据间距为0.5分,修改底部数字标签,以实际评分区间为底部标签数值,标签要显示完整,并分析电影评分直方图。
可以看到整体评分呈现正态分布,电影评分多处于至5.5分-7.9分之间,8.0分至9.5分为高分电影和5.5分以下为两级
以上是关于大数据分析-零基础学Tableau+超详细讲解+示例练习的主要内容,如果未能解决你的问题,请参考以下文章