数据分析前期
Posted alexzhang92
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了数据分析前期相关的知识,希望对你有一定的参考价值。
Python版本
Python 2 or Python 3
- Python 2.x 是早期版本,Python 3.x是当前版本
- Python 2.7 (2.x的最终版)于2010年发布后很少有大的更新
- Python 2.x 比 Python3.x 拥有更多的工具库
- 大多数Linux系统默认安装的仍是 Python 2.x
- 版本选择取决于要解决的问题
建议选择 Python 2.x 的情况:
- 部署环境不可控,Python版本不能自行选择
- 某些工具库还没有提供支持 Python 3.x。
- 如果选择使用 Python 3.x,需要确定要用的工具库支持新版本。
注意:本课程将会使用Python 3.x 版本
Python环境及IDE
Python环境
Anaconda(水蟒)
:是一个科学计算软件发行版,集成了大量常用扩展包的环境,包含了 conda、Python 等 180 多个科学计算包及其依赖项,并且支持所有操作系统平台。下载地址:https://www.continuum.io/downloads
安装包:pip install xxx,conda install xxx
卸载包:pip uninstall xxx,conda uninstall xxx
升级包:pip install upgrade xxx,conda update xxx
IDE
Jupyter Notebook:
命令:jupyter notebook
- Anaconda自带,无需单独安装
- 实时查看运行过程
基本的web编辑器(本地)
- .ipynb 文件分享
- 可交互式
- 记录历史运行结果
IPython:
命令:ipython
- Anaconda自带,无需单独安装
Python的交互式命令行 Shell
- 可交互式
- 记录历史运行结果
- 及时验证想法
Spyder:
命令:spyder
- Anaconda自带,无需单独安装
- 完全免费,适合熟悉Matlab的用户
功能强大,使用简单的图形界面开发环境
PyCharm:
- 需要自行安装:https://www.jetbrains.com/pycharm/download
- PyCharm,JetBrains的精品,全平台支持,不多解释了。
以上是关于数据分析前期的主要内容,如果未能解决你的问题,请参考以下文章
python 用于数据探索的Python代码片段(例如,在数据科学项目中)