数据可视化之Storytelling with Data

Posted iesi

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了数据可视化之Storytelling with Data相关的知识,希望对你有一定的参考价值。

项目对象、内容和方式的的重要性

我们必须识别出具体的受众,明确他们需要了解什么或者作什么,并决定用什么数据阐释我们的情况。

  1. 有哪些至关重要的背景信息

  2. 受众决策者都是谁?对他们有什么了解?

  3. 受众可能对话题存在什么样的正面或者负面偏见

  4. 有什么样的数据可以支撑这个案例?这些数据是受众所熟悉的还是新的?

  5. 有什么风险?什么因素会弱化案例?我们是否要主动提出来?

  6. 成功的产出是什么?

  7. 如果时间有限或者只能用一句话告诉受众需要做什么,你会说什么?


选择有效的图表

  1. 简单文本:当只有一两项数据需要分享时,直接用数据本身

  2. 表格:用灰色让边框融入背景,或者干脆去掉边框

  3. 热力图:用颜色饱和度提供视觉上的暗示

  4. 散点图:展示两件事的关系时很有用

  5. 折线图:画图时务必保证时间间隔的一致性

  6. 斜率图:适用于两个时间段或者两组对比数据点

  7. 条形图:受众的学习成本更低,易于阅读

  8. 瀑布图:可用于抽离出堆叠条形图中的一部分进行重点关注,或者展示起点和结果以及其中的上升下降关系

  9. 水平条形图:非常容易阅读

  10. 堆叠水平条形图:可以展示不同类别间整体或者子成分的比较,也同样可以按绝对值或百分比进行组织

  11. 面积图:需要可视化相差极大的数值时


视觉认知的格式塔原则

  1. 领近原则:我们倾向认为物理上临近的物体属于同一个群体

  2. 相似原则:拥有相似颜色、形状、大小或者方向的物体会被视作相关或从属于一个群体

  3. 包围原则:我们会认为物理上包围在一起的物体从属于同一群体

  4. 闭合原则:人们希望事情能够简化并符合脑海中已经存在的结构

  5. 连续原则:当我们观察物体时,尽管没有显式的路径,但我们的眼睛倾向于寻找最平稳的路径并自然的创造出连续性

  6. 连接原则:我们倾向于将物理连接的物体视作一个群体



循序渐进地除去杂乱

  1. 去除图形边框

  2. 去除网格线

  3. 去除数据标记

  4. 清理坐标轴标签

  5. 直接标记数据

  6. 保持颜色一致


构建故事

  1. 设定:故事发生在何地

  2. 主角:谁在驱动情节的发展?

  3. 失衡:为什么冲突是必要的?发生了哪些变化?

  4. 平衡:你希望看到发生什么?

  5. 解决:你会如何带来变化

  6. 覆盖相关背景,进而推动情况和问题进一步发展

  7. 结合外部上下文对比

  8. 举例说明问题

  9. 包括能够说明的数据

  10. 阐述如果不采取行动或者不发生变化会怎样

  11. 讨论解决的潜在选择

  12. 说明建议方案的优势

  13. 向受众明确为什么他们会处在这一决策的位置

  14. 呼吁行动结束


以上是关于数据可视化之Storytelling with Data的主要内容,如果未能解决你的问题,请参考以下文章

seaborn可视化水平箱图并添加抖动数据点(Horizontal boxplot with jittered points in Python)

循环控制语句 之 with_nested

pandas数据预处理(字段筛选query函数进行数据筛选缺失值删除)seaborn使用Catplot函数可视化基本箱图(Boxplot with Seaborn Catplot)

matplotlib可视化连接成对数据点的线图只显示线条不显示数据点(Paired Line Plot with Matplotlib but without points)

R语言plotly可视化:使用UMAP算法将图像数据降维到二维并使用plotly可视化降维后的图像数据(project image data into 2D with UMAP)

R语言ggplot2可视化水平箱图(Horizontal boxplot with coord_flip)并添加抖动数据点显示分布情况(jittered points)