血压数据的可视化和分析
Posted healthdata
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了血压数据的可视化和分析相关的知识,希望对你有一定的参考价值。
根据世界卫生组织规定,成人收缩压≥140mmHg或(和)舒张压≥90mmHg时即可确诊为高血压。收缩压≤120mmHg称为理想血压,收缩压≤130mmHg称为正常血压,介于130和140之间者,称为临界高血压。
现有一份血压数据,样本记录500条数据,包括三个值:血压、是否抽烟、体重过重级别。
数据样例:
血压数据的可视化和分析(1)—— 利用 Excel 查看数据概况
在 Excel 中,利用散点图首先对这三列数据进行可视化,了解数据分布的概况。
- 各列数据的独立分布
可见收缩压数据在250左右有一个明显的分界,之前的数据都在150以下,之后的数据都在150以上。收缩压范围在50-250之间
是否抽烟的数据分布,只有两个值,一般来说1表明是,0表示否。
体重级别的数据分布分3类,不能确定0,1,2分别代表什么意思,这部分说明数据提供者没有给出,我们在接下来的数据分析中进行猜测。
2. SystolicBP和Smoke的相关分布
从中可以看出不抽烟的人群收缩压下限明显要低一些。
3. SystolicBP和Overwt的相关分布
可以看到体重级别为0的人,收缩压下限较低。
由图2,中间部分重叠严重,我们看不出具体的密度分布,不抽烟的人到底120多一些,还是150多一些呢?符合这类要求图表目前无法在Excel中简单地建立,我们通过Python/R等可视化工具来做进一步分析。
以上是关于血压数据的可视化和分析的主要内容,如果未能解决你的问题,请参考以下文章