数据可视化的六大误区,为何你只能做出“渣”图表 | 图表家族#35

Posted 镝次元数据

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了数据可视化的六大误区,为何你只能做出“渣”图表 | 图表家族#35相关的知识,希望对你有一定的参考价值。


编辑/ 王艺      版面/李艺佳


镝摘

无论是制图还是读图,可视化的学习和实践道路上我们难免碰到各式各样的问题。想要制作一个正确的图表,我们应该避免哪些“大坑”呢?本期我们就来看看常见的可视化误区吧~


喜欢可视化的朋友们,做一个好图表很难,做图不犯错也不容易。图表的目的是提供更容易、快速的理解管道,在这个目的之下很多信息被简化、隐含了,但这简化的过程却不一定能将资料完整的重现出来,以致于有时候甚至与本意完全相反地误导了读者的思考。

 

一张“不完美”的图表其成因是多方面的,可能是由于数据和图表类型不匹配,也可能是配色等参数设置不当……下面我们将介绍七种常见的图表问题,帮助大家重新审视自己的可视化作品或阅读过程。


你的数据真的适合你的图表吗?


这个问题显然是制作图表首先要考虑的。针对已有的数据,先问一问自己:我想要展示这些数据的趋势还是占比?是分布还是比较?实际上,这个看似简单的问题曾难倒了许多可视化爱好者。

 

图表的类型多种多样,在可视化的海洋中,每一种图表都有其存在的意义,其特点和应用也都不尽相同。比如饼图是展示占比的最佳选择,线图则常用于展示数据变化趋势,对于大量数据的分布情况则通常用散点图进行可视化。



不合适的图表往往带来无意义的故事。比如在下图中我们可以看到日本料理中各品种的价格走向,从味增汤一路增长到生鱼片,最终跌落至茶碗蒸。相信你也看不懂这些料理价格的跌涨有什么意义。显然这些数据更适合用柱图来比较其大小,而不是用线图展示趋势。


数据可视化的六大误区,为何你只能做出“渣”图表 | 图表家族#35


慎用三维图表


尽管你可能见过不少的三维图表,甚至一些工具也都支持三维图表的制作,但是三维图表在大多场合并不十分适用,尤其是在强调数据对比分析的应用场景中,三维图表在给读者带来酷炫视觉效果的同时,往往会扭曲数据本身的真实性,从而影响受众对结果的判断。

 

以下面的饼图为例,我们可以看到三维图表是如何扭曲数据的真实性的。


数据可视化的六大误区,为何你只能做出“渣”图表 | 图表家族#35


如上图所示,左侧的饼图是三个120度等分的扇形,而在三维转换成右侧的图表之后,灰色填充的扇形的角度则大于120度,红蓝两色填充的扇形图则小于120度,这样造成的视觉错觉就是“灰色填充的扇形对应的数据大于红蓝两色填充的扇形对应的数据”,而事实上三个扇形对应的数据是相等的。

 

这个原理其实很简单,当一个东西变成立体的时候,远的地方视觉上会小一点,近处则会大一些


数据可视化的六大误区,为何你只能做出“渣”图表 | 图表家族#35


下图来自2008年乔布斯的一次演讲,你能发现其中的端倪吗?


数据可视化的六大误区,为何你只能做出“渣”图表 | 图表家族#35

图片来源:https://www.engadget.com/2008/01/15/live-from-macworld-2008-steve-jobs-keynote/


显然,下方Apple的份额(19.5%)看起来比上方的其它品牌的份额(21.2%)还要大,但我们都知道事实并非如此。在制图时,除非你想要达到这样的混淆效果,从而强调某个数据,否则这将很大程度上误导你的读者。

 

同样,对于图表的接受者而言,当看到类似的三维图表时,一定要保持一定的警惕心理


地图区域造成的误导


地图是可视化的一个重要板块。地理可视化的一个关键点就是通过地理区域的划分,便于读者查看不同地理区域的数据分布情况。通常地图会给不同区域着色(比如渐变色)来展示人口或选举数据。比如用红色和蓝色分别表示投票的不同结果。但是问题在于区域的大小不见得与图表的议题相关,有时甚至会有误导之嫌。

 

例如执政党着色这一点,通常我们比较想关心的是有政党范围下影响了多少人,但是人口不尽然与土地面积正相关。这就造成了一个有趣的现象。以我国台湾为例,因为台湾山地的行政区面积通常比较大,如果某政党获得了较多山地区域的执政权,画图出来时很可能你会以为该政党占有较高的支持率,即便这些山地区域的人口数仅占全台湾人口的 1% 。


你真的需要堆叠图表吗?


在基础图表的基础上,我们会看到许多进阶图表,比如“堆叠柱状图”、“堆叠面积图”、“堆叠条形图”等等。“堆叠”的意义和字面意思一样,也就是在同一坐标轴上,将数据进行堆叠放置。除了底层的数据,其它数据的起始点并非是0,而是在上一层数据的基础上。

 

以堆叠面积图为例。我们可以看到以下两类数据随着时间的推移似乎都在增大。


数据可视化的六大误区,为何你只能做出“渣”图表 | 图表家族#35


然而转化为折线图之后,我们可以清晰地看到不动产开发业的薪资水平实际上是有所下降的。幅度并不是很明显,也似乎有反弹趋势,但是相对上面的堆积图是否更容易能比较出走势与差异呢?


数据可视化的六大误区,为何你只能做出“渣”图表 | 图表家族#35


事实上堆叠图的用途更接近于比较相对性(百分比堆叠柱状图就是一个好例子),类似饼图等,同时它有类似线图的走势特性所以适合用来比较各种资料间时序上的比例大小。总之,图表本身并不是个问题,如何使用它才是问题的关键,你能否好好的利用这些图表?就看你能否能把握可视化的重点——各种不同的资料,搭配上你希望表达的故事,都有其最适合的表现形式。


因果倒置的图表解释不可取


数据可视化的六大误区,为何你只能做出“渣”图表 | 图表家族#35


想要证明什么吗?拿两条线来,再来个问题就行了。彭博商业周刊( BusinessWeekly ) 在2011年发表了一篇图表说明相关性与因果关系的误用,其中最经典的图是一座山脉与纽约谋杀案件比率的吻合——这太惊人了!原来纽约谋杀犯罪率跟山的走势相同!那么山脉接下来的走势可以预测犯罪率的变化吗?答案显示是不行。


数据可视化的六大误区,为何你只能做出“渣”图表 | 图表家族#35

     图片来源:http://www.bloomberg.com/bw/magazine/correlation-or-causation-12012011-gfx.html


在制作图表时,你可能会有一些有趣的想法跟发现。比如试着叠合人口数与年收入?好像人越多的地方收入越高。只要你愿意,你可能总会找到某两个事件发展趋势的一致性。这是个不错的尝试,但千万要记住:你也许可以发现什么,但这不代表你证明了什么。


参数设置也很重要


为了图表的美观,图表的细节设置也需要我们费一番功夫。比如柱状图每个柱子之间的间隔太宽或太窄都不好看,应该根据柱宽而设置间隔宽度。而在配色方面,渐变色则是又好看又简单的配色,切忌在可视化中使用花里胡哨而没有实际意义的配色,从而喧宾夺主,将读者对数据本身的注意力转移了。

 

幸运的是,镝数作为一款轻量级的可视化工具,却完美规避了许多用户制图中可能遇到的问题。比如在图表种类方面,镝数现有80多个精美模板,无需编程即可生成酷炫的图表;在数据方面,每个图表都有样例数据和介绍,针对已有数据镝数还可以“一键可视化”,使你的数据和图表都不会出错;在配色方面,镝数推出了一键换肤功能,提供商务、学术、媒体等风格的配色方案给用户免费使用……你还不快来镝数试一试!




好了,今天的分享就到这里,如果有更多关于镝数的问题,请发送邮件至 public@dyclub.io或直接在后台留言


咱们下期再见!

 

参考来源:

http://blog.infographics.tw/2015/02/seven-common-chart-visualization-mistakes/

http://www.sohu.com/a/106283976_185201


往期回顾


            

      

       

       

       

       

       

   



以上是关于数据可视化的六大误区,为何你只能做出“渣”图表 | 图表家族#35的主要内容,如果未能解决你的问题,请参考以下文章

数据可视化中图表使用的误区|大简学苑

Ruby | 掌握技巧避开这六大误区,高品质墙布这样选择就对了!

手把手教你做出数据可视化项目可视化图表配置

手把手教你做出数据可视化项目可视化图表配置

手把手教你做出数据可视化项目可视化图表数据动态获取及界面跳转

手把手教你做出数据可视化项目可视化图表数据动态获取及界面跳转