python预测分析--环境搭建

Posted 快乐崇拜234

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了python预测分析--环境搭建相关的知识,希望对你有一定的参考价值。

正文在下面,先打个广告:

Python数据处理分析是很强大的,本文介绍环境搭建,依赖包的引用等,为后面学习做准备。

statsmodels

   statsmodels(http://www.statsmodels.org)是一个Python库,用于拟合多种统计模型,执行统计测试以及数据探索和可视化。statsmodels包含更多的“经典”频率学派统计方法,而贝叶斯方法和机器学习模型可在其他库中找到。

statsmodels是一个Python软件包,为scipy提供了补充,以进行统计计算,包括描述性统计以及统计模型的估计和推断。

statsmodels主要包括如下子模块:
回归模型:线性回归,广义线性模型,稳健的线性模型,线性混合效应模型等等。
方差分析(ANOVA)。
时间序列分析:AR,ARMA,ARIMA,VAR和其它模型。
非参数方法: 核密度估计,核回归。
统计模型结果可视化。
比较:statsmodels更关注统计推断,提供不确定估计和参数p-value。相反的,scikit-learn注重预测。

statsmodels中文翻译教程:https://github.com/Squidxwh/statsmodels

遇到的问题

statsmodels需要python3.6及以上版本。参加statsmodels官网。所以要先安装python3, 可以参考 python开发环境搭建

安装或升级pip

sudo easy_install pip

如果后面在安装包的时候提示pip版本低,则需要升级pip。或者你直接在一步升级一下。

python3 -m pip install --user --upgrade pip

python中pip的问题 SyntaxError: invalid syntax

当Python2和Python3同时存在于windows上时,无论在Python2还是在Python3的Scripts文件目录下执行pip install XXX命令是总提示SyntaxError: invalid syntax,此时需要制定python.exe启动器才能正常安装,比如python3 -m pip install ***

依赖包安装

在使用statsmodels 的过程中,需要安装多个依赖。

由于我电脑上安装了python2, 和python3,python2并没有移除,所以在安装依赖包时需要指定Python版本。

python3 -m pip install --upgrade patsy
python3 -m pip install --user statsmodels
python3 -m pip install --user matplotlib
python3 -m pip install --user seaborn
python3 -m pip install --user sklearn

注:

atplotlib 是 Python 的绘图库。
Seaborn是基于matplotlib的图形可视化python包。它提供了一种高度交互式界面,便于用户能够做出各种有吸引力的统计图表。

参考

  • https://github.com/shuang0420/shuang0420.github.io/wiki/installing-statsmodels-for-python-on-mac-osx
  • https://github.com/Squidxwh/statsmodels
  • https://www.runoob.com/python/python-object.html
  • https://www.statsmodels.org/stable/install.html
  • https://blog.csdn.net/yunqiinsight/article/details/79741483
  • https://blog.csdn.net/kyle870322/article/details/88643018
  • https://blog.csdn.net/zzx2016zzx/article/details/83099583

另外的一个牛逼的机器学习的库:sklearn http://www.scikitlearn.com.cn/

以上是关于python预测分析--环境搭建的主要内容,如果未能解决你的问题,请参考以下文章

贝叶斯分类器(10X单细胞和10X空间转录组的基础算法)

概率论和数理统计_07_频率学派和贝叶斯学派基本知识

《概率统计》经典统计推断:寻找最大似然

贝叶斯分类器(1)贝叶斯决策论概述、贝叶斯和频率、概率和似然

这是我最想推荐给程序员们看的基于Python3实现的数据科学书

时序分析 29 - 时序预测 - 格兰杰因果关系(下) python实践2