数据挖掘与机器学习课程学习笔记——2
Posted shi_zi_183
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了数据挖掘与机器学习课程学习笔记——2相关的知识,希望对你有一定的参考价值。
Numpy
简介
NumPy是Python的一种开源的数据计算扩展库。包含很多功能:
1)创建n维数组(矩阵)
2)对数组进行函数运算
3)数值积分
4)线性代数运算
5)傅里叶变换
6)随机数产生
NumPy是在1995年诞生的Python库Numeric的基础上建立的。但真正促使NumPy的发行的是Python的SciPy库。
SciPy是2001年发行的一个类似于Matlab,Maple,Mathematica等数学计算软件的Python库,它实现里面的大多数功能。
但SciPy中并没有合适的类似于Numeric中的对于基础的数据对象处理的功能。于是,SciPy的开发者将SciPy中的一部分和Numeric的设计思想结合,在2005年发行了NumPy。
NumPy基本对象
标准的Python中用list保存值,可以当作数组使用,但因为列表中的元素可以是任何对象,所以浪费了CPU运算时间和内存。
为了弥补这些缺陷。它提供了两种基本的对象:
ndarray:全称(n-dimensional array object)是储存单一数据类型的多维数组。
ufunc:全称(universal function object)它是一种能够对数组进行处理的函数。
安装Numpy
开发环境中
Anaconda和Pycharm等开发环境已经安装了NumPy
原生python安装
pip install numpy
ndarray
普通矩阵
NumPy中的核心对象是ndarray。
ndarray可以看成数组,类似于R语言的向量或者矩阵。
NumPy里面所有的函数都是围绕ndarray展开的。
a=np.array([1,2,3,4])
b=np.array((1,2,3,4))
c=np.array([[1,2,3,4],[5,6,7,8]])
ndarray对维数没有限制
[]
从内到外分别为第0轴,第1轴,第2轴。
c第0轴长度为2,第1轴长度为4.
特殊矩阵
NumPy提供了专门用于生成ndaarray的函数,提高了创建ndarray的速度
a=np.arange(0,1,0.1)#0-1,步长0.1
b=np.linspace(0,1,10)#0-1,等分成10分
c=np.linspace(0,1,10,endpoint=False)#0-0.9,等分成10分
d=np.logspace(0,2,5)#10的0-2次幂,等分成5分
创建空矩阵
np.empty((2,3),np.int)#创建2*3的整形空矩阵,只分配内存
np.zeros(4,np.int)#创建长度为4,值全部为0的矩阵
np.full(4,np.pi)#创建长度为4,值全部为pi的矩阵
元素类型
ndarray的元素具有相同的元素类型。常用的有int,float,complex(复数)
a=np.array([1,2,3,4],dtype=float)
a.dtype
shape属性
ndarray的shape属性用来获得它的形状,也可以自己指定。
c=np.array([1,2,3,4],[4,5,6,7],[7,8,9,10])
c.shape
a=np.array([1.2.3.4])
d=a.reshape((2,2))
注:形状改变时需要注意元素个数
当不确定行数或列数使,可以使用-1表示
d=np.reshape((-1,1))#转化为n行1列的矩阵
ndarray的切片
darray的切片和list是一样的
a=np.arange(10)
a[5]
a[3:5]
a[:5]
a[:-1]
a[1:-1:2]
a[::-1]
a[5:1:-1]
可以通过切片对ndarray中的元素进行更改
a[2:4]=100,101
ndarray通过切片产生一个新的数组b,b和a共享同一块数据存储空间
如果想改变这种情况,我们可以用列表对数组元素切片或使用copy函数
b=a[[1,2,3]]#获取下标为1,2,3的元素组成b
b=a[:].copy()
多维数组的切片
a=np.arange(0,60,10).reshape(-1,1)+np.arange(0,6)
如果我们想创立原数组的副本,我们可以用整数元组,列表,整数数组,布尔数组进行切片。
以上是关于数据挖掘与机器学习课程学习笔记——2的主要内容,如果未能解决你的问题,请参考以下文章