数据可视化之Storytelling with Data
Posted iesi
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了数据可视化之Storytelling with Data相关的知识,希望对你有一定的参考价值。
项目对象、内容和方式的的重要性
我们必须识别出具体的受众,明确他们需要了解什么或者作什么,并决定用什么数据阐释我们的情况。
有哪些至关重要的背景信息?
受众和决策者都是谁?对他们有什么了解?
受众可能对话题存在什么样的正面或者负面偏见?
有什么样的数据可以支撑这个案例?这些数据是受众所熟悉的还是新的?
有什么风险?什么因素会弱化案例?我们是否要主动提出来?
成功的产出是什么?
如果时间有限或者只能用一句话告诉受众需要做什么,你会说什么?
选择有效的图表
简单文本:当只有一两项数据需要分享时,直接用数据本身
表格:用灰色让边框融入背景,或者干脆去掉边框
热力图:用颜色饱和度提供视觉上的暗示
散点图:展示两件事的关系时很有用
折线图:画图时务必保证时间间隔的一致性
斜率图:适用于两个时间段或者两组对比数据点
条形图:受众的学习成本更低,易于阅读
瀑布图:可用于抽离出堆叠条形图中的一部分进行重点关注,或者展示起点和结果以及其中的上升下降关系
水平条形图:非常容易阅读
堆叠水平条形图:可以展示不同类别间整体或者子成分的比较,也同样可以按绝对值或百分比进行组织
面积图:需要可视化相差极大的数值时
视觉认知的格式塔原则
领近原则:我们倾向认为物理上临近的物体属于同一个群体
相似原则:拥有相似颜色、形状、大小或者方向的物体会被视作相关或从属于一个群体
包围原则:我们会认为物理上包围在一起的物体从属于同一群体
闭合原则:人们希望事情能够简化并符合脑海中已经存在的结构
连续原则:当我们观察物体时,尽管没有显式的路径,但我们的眼睛倾向于寻找最平稳的路径并自然的创造出连续性
连接原则:我们倾向于将物理连接的物体视作一个群体
循序渐进地除去杂乱
去除图形边框
去除网格线
去除数据标记
清理坐标轴标签
直接标记数据
保持颜色一致
构建故事
设定:故事发生在何地?
主角:谁在驱动情节的发展?
失衡:为什么冲突是必要的?发生了哪些变化?
平衡:你希望看到发生什么?
解决:你会如何带来变化?
覆盖相关背景,进而推动情况和问题进一步发展
结合外部上下文和对比点
举例说明问题
包括能够说明的数据
阐述如果不采取行动或者不发生变化会怎样
讨论解决的潜在选择
说明建议方案的优势
向受众明确为什么他们会处在这一决策的位置
以呼吁行动结束
以上是关于数据可视化之Storytelling with Data的主要内容,如果未能解决你的问题,请参考以下文章
seaborn可视化水平箱图并添加抖动数据点(Horizontal boxplot with jittered points in Python)
pandas数据预处理(字段筛选query函数进行数据筛选缺失值删除)seaborn使用Catplot函数可视化基本箱图(Boxplot with Seaborn Catplot)
matplotlib可视化连接成对数据点的线图只显示线条不显示数据点(Paired Line Plot with Matplotlib but without points)
R语言plotly可视化:使用UMAP算法将图像数据降维到二维并使用plotly可视化降维后的图像数据(project image data into 2D with UMAP)
R语言ggplot2可视化水平箱图(Horizontal boxplot with coord_flip)并添加抖动数据点显示分布情况(jittered points)