Python大数据分析学习基础篇——Spyder和Numpy
Posted Tiramisu1104
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Python大数据分析学习基础篇——Spyder和Numpy相关的知识,希望对你有一定的参考价值。
一、Spyder
1、代码提示
代码提示是开发工具必备的功能,当用户需要Spyder给出代码提示时,只需要输入函数名的前几个字母,在按下Tab键,即可得到IDE的代码提示,Spyder界面如图所示。
Spyder界面
2、变量浏览
变量是代码执行过程中暂时停留在内存中的数据,可以通过Spyder对变量承载的数据进行查看,方便用户对数据进行处理。
变量浏览框中包含了变量的名称、类型、尺寸、以及预览,双击对应的变量所在的行,即可打开变量的详细数据进行查看。
3、图形查看
绘图是进行数据分析必备的技能之一,一款好的工具,必须具备图形绘制的功能,Spyder窗体还集成了绘图的功能
下面网址提供了Anaconda 所包含的全部依赖包:http//docs.continuum.io/anaconda/pkg-docs.html其中用于科学计算的Numpy.theano,几乎应有尽有。
尽管Anaconda整合了很多包,但他也不是万能的,下面介绍安装爬虫scrapy包,只需要在开始菜单选择Anaconda->Anaconda Prompt 命令,在弹出界面输入“conda install scrapy"命令即可安装。
二、Numpy简介
Numpy的数据结构是N维的数组对象,叫做ndarray。
In[1]:
import numpy as np
detal = [1,2,3,4,5]
arrayl =np.array(datal)
arrayl
Out[1]:
array([1,2,3,4,5])
三、关于pandas
1、什么是pandas
pandas是Python的一个数据分析包pandas最初是被作为金融数据分析工具而开发出来的,因此,pandas为时间序列分析提供了很好的支持。
2、pandas中的数据结构
pandas除了panel数据结构,还引入了两种新的数据结构——series和DataFrame,这两种数据结构都建立在Numpy的基础上。
(1)Series:一维数组系列,也称序列,与Numpy中的一维array类似。二者与Python基本的数据结构List也很接近。
(2)DataFrame:二维表型数据结构,可以将DataFrame理解为series的容器。
(3)panel:三维数组,可以理解为DataFrame的容器
3、数据类型
1、python 常用的3种数据类型为:Logical、Numeric、Character
(1)Logical(逻辑型)
Logical又叫布尔型,只有两种取值:0和1,或者真和假
逻辑运算符有& | not
(2)Numeric(数值型)
数值运算符:+、-、*、/。
(3)Character(字符型)
字符型数据一般用单引号或者双引号包起来。
4、数据结构
数据结构是指相互之间存在的一种或者多种特定关系的数据类型的集合。
pandas中主要有series和Dataframe两种数据结构。
在Spyder写入如下代码:
from pandas import Series
A = Series([1,2,3])
print(A)
#输出如下
"""
0 1
1 2
2 3
dtype: int64
"""
from pandas import Series
A = Series([1,2,3],index = [1,2,3])
print(A)
"""
1 1
2 2
3 3
dtype: int64
"""
以上是关于Python大数据分析学习基础篇——Spyder和Numpy的主要内容,如果未能解决你的问题,请参考以下文章