图解:什么是数据可视化

Posted 书圈

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了图解:什么是数据可视化相关的知识,希望对你有一定的参考价值。

人类视觉感知到心理认知的过程要经过信息的获取、分析归纳、存储、概念、提取、使用等一系列加工阶段。尽管不同领域的数据可视化面向不同数据,面临不同的挑战,但可视化的基本步骤和流程是相同的。本章将学习如何从社会自然现象数据中提取信息、知识和灵感的可视化基本流程。


数据可视化流程


可视化不是一个单独的算法,而是一个流程。除了视觉映射外,也需要设计并实现其他关键环节,如前端的数据采集、处理和后端的用户交互。这些环节是解决实际问题必不可少的步骤,且直接影响可视化效果。作为可视化设计者,解析可视化流程有助于把问题化整为零,降低设计的复杂度。作为可视化开发者,解析可视化流程有助于软件开发模块化、提高开发效率、缩小问题范围、重复利用代码,有助于设计工具库、编程界面和软件模块。

数据可视化是一个流程,有点像流水线,但这些流水线之间是可以相互作用的、双向的。可视化流程以数据流为主线,其主要包括数据采集、数据处理和变换、可视化映射、用户感知这些模块。下图列出一个数据可视化流程。


图   数据可视化流程



图中涉及如下几个主要模块。

(1) 数据采集。数据的采集直接决定了数据的格式、维度、尺寸、分辨率、精确度等重要性质,在很大程度上决定了可视化结果的质量。

(2) 数据处理和变换。数据处理和变换是可视化的前期处理。一方面原始数据不可避免地含有噪声和误差;另一方面,数据的模式和特征往往被隐藏。而可视化需要将难以理解的原始数据变换成用户可以理解的模式和特征并显示出来。这个过程包括去除数据噪声、数据清洗、提取特征等,为之后的可视化映射做准备。

(3) 可视化映射。可视化映射是整个可视化流程的核心,它将数据的数值、空间位置、不同位置数据间的联系等,映射到不同的视觉通道,如标记、位置、形状、大小和颜色等。这种映射的最终目的是让用户通过可视化,洞察数据和数据背后隐含的现象和规律。因此可视化映射的设计不是一个孤立的过程,而是和数据、感知、人机交互等方面相互依托,共同实现的。

(4) 用户感知。数据可视化和其他数据分析处理办法的最大不同是用户的关键作用。用户借助数据可视化结果感受数据的不同,从中提取信息、知识和灵感。可视化映射后的结果只有通过用户感知才能转换成知识和灵感。用户感知可以在任何时期反作用于数据的采集、处理变换以及映射过程中,如图31所示。

数据可视化可用于从数据中探索新的假设,也可证实相关假设与数据是否吻合,还可以帮助专家向公众展示数据中的信息。用户的作用除被动感知外,还包括与可视化其他模块的交互。交互在可视化辅助分析决策中发挥了重要作用。有关人机交互的探索已经持续了很长时间,但智能、适用于海量数据可视化的交互技术,如任务导向的、基于假设的方法还是一个未解难题。

上面的可视化流程虽然简单,但也要注意以下两点。

 上述过程都是基于数据背后的自然现象或者社会现象,而不是数据本身。

 图中各个模块的联系并不是顺序的线性的联系,它们之间的联系更多是非线性的,任意两个模块之间都可能存在联系。

以上是关于图解:什么是数据可视化的主要内容,如果未能解决你的问题,请参考以下文章

图解大数据 | 综合案例-使用Spark分析挖掘音乐专辑数据

高清图解:神经网络机器学习数据科学一网打尽

Matplotlib--用Python创建各种数据可视化图形

图解-使用变异系数赋予权重,并比较效果

图解-使用变异系数获取权重,并比较效果

图解NumPy,这是理解数组最形象的一份教程了