1 一元数据集的分布
Posted
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了1 一元数据集的分布相关的知识,希望对你有一定的参考价值。
参考技术A 本文将介绍一个python的数据可视化利器,seaborn结合matplotlib,在数据Exploration阶段助你无往不利!我们拿到数据,第一件事就是想看看数据的分布,本章将介绍一元变量的分布。
首先导入必备的库:
一元变量最快速的画法是distplot(), 默认将绘制直方图和核密度估计图(KDE)
matplotlib中也有个直方图函数hist,表示每个bins中间散落的数据的个数,以此表示数据的分布。我们去掉密度曲线,使用rug(每个数据一个小竖线)来显示。当然单独的rugplot也能显示。
在绘制分布的形状上KDE是很有效的,y轴表示了密度值。
带阴影的
高斯KDE,反应整体走势,去除极值
另一个反应极值的参数是cut
以上是关于1 一元数据集的分布的主要内容,如果未能解决你的问题,请参考以下文章