Python数据分析初始

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Python数据分析初始相关的知识,希望对你有一定的参考价值。

基础库

pandas:python的一个数据分析库(pip install pandas)

seaborn:数据可视化 (pip install seaborn)

scipy:数值计算库(pip install scipy)

  • SciPy (pronounced "Sigh Pie") 是一个开源的数学、科学和工程计算包。它是一款方便、易于使用、专为科学和工程设计的Python工具包,包括统计、优化、整合、线性代数模块、傅里叶变换、信号和图像处理、常微分方程求解器等等。

matplotlib:数据可视化 (pip install matplotlib)

  • Matplotlib是一个Python的图形框架,类似于MATLAB和R语言。它是python最著名的绘图库,它提供了一整套和matlab相似的命令API,十分适合交互式地进行制图。而且也可以方便地将它作为绘图控件,嵌入GUI应用程序中。

sklearn:建模,科学计算库(pip install scikit-learn)

  • Scikit-Learn是基于python的机器学习模块,基于BSD开源许可。Scikit-learn的基本功能主要被分为六个部分,分类,回归,聚类,数据降维,模型选择,数据预处理。

numpy:线性代数、向量矩阵等,科学运算库(pip install numpy)

  • NumPy(Numeric Python)系统是Python的一种开源的数值计算扩展,一个用python实现的科学计算包。它提供了许多高级的数值编程工具,如:矩阵数据类型、矢量处理,以及精密的运算库。专为进行严格的数字处理而产生。内容包括:1、一个强大的N维数组对象Array;2、比较成熟的(广播)函数库;3、用于整合C/C++和Fortran代码的工具包;4、实用的线性代数、傅里叶变换和随机数生成函数。numpy和稀疏矩阵运算包scipy配合使用更加方便。

Windows环境可以到 http://www.lfd.uci.edu/~gohlke/pythonlibs/ 下载安装

 

 

工具

ipython notebooks:Python做教学、计算、科研的一个重要工具

pip install ipython
pip install "ipython[notebook]"

访问命令:ipython notebook

 

四分位数

四分位数(Quartile),即统计学中,把所有数值由小到大排列并分成四等份,处于三个分割点位置的数值就是四分位数。

示例:

首先确定四分位数的位置:(n表示项数)

  • Q1的位置= (n+1) × 0.25
  • Q2的位置= (n+1) × 0.5
  • Q3的位置= (n+1) × 0.75

对于四分位数的确定,有不同的方法,另外一种方法基于N-1 基础。即

  • Q1的位置=1+(n-1)x 0.25
  • Q2的位置=1+(n-1)x 0.5
  • Q3的位置=1+(n-1)x 0.75

Excel 中有两个四分位数的函数。QUARTILE.EXC 和QUARTILE.INC

 

以上是关于Python数据分析初始的主要内容,如果未能解决你的问题,请参考以下文章

Jekyll 偏移代码片段高亮的初始行

将初始数据提供给片段的正确方法?

将初始数据提供给片段的正确方法?

如何在使用cardview的片段中初始化gridlayoutmanager?

如何初始化片段中的绑定属性以使双向数据绑定工作

java 只有在可见并完成初始化时才会丢弃数据的片段。