血压数据的可视化和分析

Posted healthdata

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了血压数据的可视化和分析相关的知识,希望对你有一定的参考价值。

根据世界卫生组织规定,成人收缩压≥140mmHg或(和)舒张压≥90mmHg时即可确诊为高血压。收缩压≤120mmHg称为理想血压,收缩压≤130mmHg称为正常血压,介于130和140之间者,称为临界高血压。

现有一份血压数据,样本记录500条数据,包括三个值:血压、是否抽烟、体重过重级别。

数据样例:

技术分享图片


 

血压数据的可视化和分析(1)—— 利用 Excel 查看数据概况

在 Excel 中,利用散点图首先对这三列数据进行可视化,了解数据分布的概况。

  1. 各列数据的独立分布

技术分享图片

可见收缩压数据在250左右有一个明显的分界,之前的数据都在150以下,之后的数据都在150以上。收缩压范围在50-250之间

 

 技术分享图片

是否抽烟的数据分布,只有两个值,一般来说1表明是,0表示否。

 

技术分享图片

 体重级别的数据分布分3类,不能确定0,1,2分别代表什么意思,这部分说明数据提供者没有给出,我们在接下来的数据分析中进行猜测。

 

2. SystolicBP和Smoke的相关分布

 技术分享图片

从中可以看出不抽烟的人群收缩压下限明显要低一些。

 

3. SystolicBP和Overwt的相关分布

技术分享图片

可以看到体重级别为0的人,收缩压下限较低。 

 

由图2,中间部分重叠严重,我们看不出具体的密度分布,不抽烟的人到底120多一些,还是150多一些呢?符合这类要求图表目前无法在Excel中简单地建立,我们通过Python/R等可视化工具来做进一步分析。

以上是关于血压数据的可视化和分析的主要内容,如果未能解决你的问题,请参考以下文章

数据可视化分析软件都有哪些?

Tableau-可视化分析入门

警务数据可视化分析

大数据可视化是啥?

数据可视化神器 | 秒出关系型数据分析图

python数据分析之:绘图和可视化及python数据分析实例