数据可视化：警告！警告！您已进入雷区

Posted 2021-04-28 TalkingData

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了数据可视化：警告！警告！您已进入雷区相关的知识，希望对你有一定的参考价值。

数据似乎推动了如今我们很多在做的事情，当然，这也是它立足于个行业的根本之一，良好的研究和结果数据可以为几乎任何问题提供“科学”而非“直接”的方法/答案。

学术界和医学界一直将研究视为收集和分析数据以证明假设、制定建议或治疗方案的关键手段，而现在每个人都在这样做。有了合适的可视化分析工具和算法，任何人都可以使用大量的数据去收集，分类和分析数据，从而推动每个经济部门的业务决策。

消费者产品和服务公司使用它来推动从库存需求到开发新产品（或改进现有产品），识别目标受众和接触这些受众的方法等。数据本身也总是有受众 - 股东，C-level决策者，医疗专业人士，教师和营销人员等等。

问题在于：通常情况下那些观看数据展示的人并不是都完全了解统计分析。因此，提供数据的人尽可能使用简单的视觉形式（图、表、信息图表等）是至关重要的，要做成能被非专业人员轻易理解的样子。

如果您打算向非专业观众展示数据，那么下面的坑或者说雷区，一定不要去踩。

使用错误的可视化工具呈现数据

您呈现的数据的目的是什么？您是否根据研究问题细分了研究人群？那么饼图可以很好的匹配这类场景，您是否试图比较人口，时间框架等？那么条形图可能是一个不错的选择。如果您试图比较两件事（例如，高管和普通员工的工资随着时间的推移平均增加），那么线型图将很好地描述这一点。

但研究人员，统计学家和设计师倾向于“结合”特定类型的图或表。然后他们试图将其数据“强制”做成该格式，结果并不尽如人意。做过一些可视化之后再看看如何描绘相似类型的数据视觉。您可能会发现，可以使用之前未使用过的设计更好地展示您的设计。

在单个可视化中放置太多数据

您希望展示出所有的信息，把你想说的话都放进同一幅可视化中，这是一个非常好的想法，但是我们自身可能会很好地理解每一个细节，可我们的受众未必可以。

反省一下您展示的主要目的。您还可以省略哪些细节？您是否可以将复杂的展示划分为一系列视觉效果而不是将其全部整合为一个？要站在观众的角度看你的可视化，特别是如果没有口头解释的机会呈现给现场受众的时候。现场展示时，可以衡量观众的反应，做一些解释并回答问题，但不在现场的话就无法做到这些。

可视化太庞杂

使用颜色和形状是很棒的选择，但太多的话会转移观众的注意力。当任何一种形式太多时，观众会厌倦看着它并试图弄清楚这一切意味着什么。请看下面美国发电厂的数据可视化

资料来源：dezyro.com

你会有多少动力去详细研究这个图表？仅仅颜色代码就十分庞杂，并且在某些情况下，甚至难以破译哪些颜色实际上对应了哪些柱形。这是一个太庞杂的例子。建议展示者可以找到更简单的模型，或将数据划分为多个图表，然后说明该国不同地理区域的趋势。

混乱或错误的数学

不做相加，或是混乱的数学。当未被捕获的数学错误发生时，数据可视化几乎毫无价值。

想一下非常流行用于显示百分比的饼图——这些百分比必须加起来为100%，否则观看者将会混淆并怀疑所呈现数据的有效性。以下是2012年美国总统初选期间一个让人啼笑皆非的饼图例子：

观众不太可能会仔细了解伴随可视化的任何解释性文字。他们会看到两件事：1、百分比加起来为193%，这是不可能的，2、佩林的那块蛋糕比其他两个候选人的小，尽管其他两个候选人所占的百分比较小。

总而言之，这是对数据的灾难性描述。事实上，研究人员允许被调查者选择不止一个候选人，因此才产生了这样的结果。“修复”这场灾难需要只允许一位候选人，这样加起来才是100%；或者可以按候选人划分为三个可视化。

数据源缺失

数据的有效性依赖于它的来源，学者和研究人员都明白这一点。收集数据再创建图表的非学者可能不了解数据来源和使用可靠来源的重要性。

“主要数据源是那些直接来自研究人员的数据，他们自己收集和分析数据。如果这些可视化资料具有可信度，那么它们就是在创建数据视觉时应该使用的数据源”。

在发布或呈现之前不“测试”

您将情感上投入到您的可视化创作中。我们“饱含深情”地去创作可视化作品，然而这种情感同时也可能意味着只可意会不可言传，解决方案是：向不熟悉数据主题的朋友或同事展示您的作品，并让他们谈谈他们地理解，如果他们理解的很好，您的可视化就可以出版或展示了。

翻译：TDU