Python数据分析初始
Posted
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Python数据分析初始相关的知识,希望对你有一定的参考价值。
基础库
pandas:python的一个数据分析库(pip install pandas)
seaborn:数据可视化 (pip install seaborn)
scipy:数值计算库(pip install scipy)
- SciPy (pronounced "Sigh Pie") 是一个开源的数学、科学和工程计算包。它是一款方便、易于使用、专为科学和工程设计的Python工具包,包括统计、优化、整合、线性代数模块、傅里叶变换、信号和图像处理、常微分方程求解器等等。
matplotlib:数据可视化 (pip install matplotlib)
- Matplotlib是一个Python的图形框架,类似于MATLAB和R语言。它是python最著名的绘图库,它提供了一整套和matlab相似的命令API,十分适合交互式地进行制图。而且也可以方便地将它作为绘图控件,嵌入GUI应用程序中。
sklearn:建模,科学计算库(pip install scikit-learn)
- Scikit-Learn是基于python的机器学习模块,基于BSD开源许可。Scikit-learn的基本功能主要被分为六个部分,分类,回归,聚类,数据降维,模型选择,数据预处理。
numpy:线性代数、向量矩阵等,科学运算库(pip install numpy)
- NumPy(Numeric Python)系统是Python的一种开源的数值计算扩展,一个用python实现的科学计算包。它提供了许多高级的数值编程工具,如:矩阵数据类型、矢量处理,以及精密的运算库。专为进行严格的数字处理而产生。内容包括:1、一个强大的N维数组对象Array;2、比较成熟的(广播)函数库;3、用于整合C/C++和Fortran代码的工具包;4、实用的线性代数、傅里叶变换和随机数生成函数。numpy和稀疏矩阵运算包scipy配合使用更加方便。
Windows环境可以到 http://www.lfd.uci.edu/~gohlke/pythonlibs/ 下载安装
工具
ipython notebooks:Python做教学、计算、科研的一个重要工具
pip install ipython pip install "ipython[notebook]"
访问命令:ipython notebook
四分位数
四分位数(Quartile),即统计学中,把所有数值由小到大排列并分成四等份,处于三个分割点位置的数值就是四分位数。
示例:
首先确定四分位数的位置:(n表示项数)
- Q1的位置= (n+1) × 0.25
- Q2的位置= (n+1) × 0.5
- Q3的位置= (n+1) × 0.75
对于四分位数的确定,有不同的方法,另外一种方法基于N-1 基础。即
- Q1的位置=1+(n-1)x 0.25
- Q2的位置=1+(n-1)x 0.5
- Q3的位置=1+(n-1)x 0.75
Excel 中有两个四分位数的函数。QUARTILE.EXC 和QUARTILE.INC
以上是关于Python数据分析初始的主要内容,如果未能解决你的问题,请参考以下文章