大数据可视化是什么?
Posted 保卫大狮兄
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了大数据可视化是什么?相关的知识,希望对你有一定的参考价值。
大数据可视化是什么?理解起来其实很简单!牢记一个公式即可——
数据+统计&分析&预测=同一表达在软件界面的结果=大数据可视化
看不太懂?举个例子——
大部分有系统运行的项目都会有原始数据,这叫系统数据:
把这些数据提取出来,分类汇总成一张数据表,这叫统计:
利用各种统计图表分析分析这张数据表,这叫数据分析:
这里分享一个我一直在用的数据分析看板的模板,对于业务端的数据分析需求来说完全够了,大家有需要的自取:
根据分析的结果以及模型&算法,预测未来发展趋势,这叫预测:
最后,将这些结果统一表达在软件界面里,形成了大数据可视化:
懂了吗?这就是大数据可视化——
所谓大数据可视化,也被成为大数据看板,是由运行系统的数据+统计、分析、预测=同一表达在软件界面的结果
从概念上来看——
数据可视化这一概念自1987年正式提出,经过30余年的发展,逐渐形成3个分支:
- 科学计算可视化(scientific visualization)
- 信息可视化(information visualization)
- 可视分析(visual analytics)
近些年来,这3 个子领域出现了逐渐融合的趋势。通常统称为“大数据可视化”。
大数据可视化有哪些技术分类?
数据可视化技术在应用过程中,多数非技术驱动,而是目标驱动。按照目前业界广泛使用的根据目标分类的数据可视化方法,数据可视化目标抽象为:
- 对比:比较不同元素之间或不同时刻之间的值
- 分布:查看数据分布特征,是数据可视化最为常用的场景之一
- 组成:查看数据静态或动态组成
- 关系:查看变量之间的相关性,常用于判断多个因素之间的影响关系
- 趋势:查看数据如何随着时间变化而变化
(1)构成
当对某一组数据中各个数值的占比进行分析时,饼图是最佳选择。
如果你想表达的信息包括:“份额”、“百分比”以及“预计将达到百分之多少”,这时候可以用到【饼图】。
但是注意,饼图只能使用一个数据系列。
当同一个系列中的数据点过多的时候,饼图将无法清楚地说明所要表达的信息。因此建议数据点不要超过6个。
(2)比较
展示事物的排列顺序是差不多,还是一个比另一个更多或更少呢?
“大于”、“小于”或者“大致相当”都是比较相对关系中的关键词,这时候会首选【条形图】 。
(3)趋势
关心数据如何随着时间变化而变化,每周、每月、每年的变化趋势是增长、减少、上下波动或基本不变,这时候使用【折线图】更好地表现指标随时间呈现的趋势 。
(4)分布
关心各数值范围内各包含了多少项目,典型的信息会包含:“集中”、“频率”与“分布”等,这时候使用【柱状图】
- 不同系列之间通过柱子的颜色进行区分。
- 每个数据点都用垂直柱体表示,柱子的高度代表数值大小。
- 横轴一般为分类项目,纵轴为不同项对应的数值。
(5)联系
主要查看两个变量之间是否表达出我们预期所要证明的模式关系。
比如预期销售额可能随着折扣幅度的增长而增长,这时候可以用【折线图】和【柱状图】来展示,用于表达“与……有关”、“随……而增长”、“随……而不同”变量间的关系。
(6)衍生形式
因为应用场景的不同,在基础图表又衍生出更多形式,给不同的数据关系以更丰富的表达。例如:
从柱状图到堆积图,我们不难发现堆积图在柱状图的基础上中展现了份额关系。
面积图强调数量随时间而变化的程度,引起人们对总值趋势的注意。面积图也可“堆积”,增加份额的概念。
观察折线图到散点图,散点图到气泡图的变化过程,可以发现散点图有更大的空间去表达数据的维度。于是,气泡图中“散点”的范围可变了。
(7)其他场景下更加具象的图表
以地图为底本展现区域动态分布,图就不放了。
项目/任务管理中十分常用的一种图表类型——甘特图。
如图示,通过活动列表和时间刻度表示出特定项目的顺序与持续时间,是项目管理一把手。
横向对比,展现不足的雷达图:
最后,从实操方面提醒下大家——
看到一个数据看板,如果你觉得科技感是不是太高了呢?有这样的感受的时候,其实这个数据可视化的项目已经失败了。
因为你没有看到数据,你只看到了界面。
以上。
相关阅读:
以上是关于大数据可视化是什么?的主要内容,如果未能解决你的问题,请参考以下文章