数据挖掘与机器学习课程学习笔记——2

Posted shi_zi_183

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了数据挖掘与机器学习课程学习笔记——2相关的知识,希望对你有一定的参考价值。

Numpy

简介

NumPy是Python的一种开源的数据计算扩展库。包含很多功能:
1)创建n维数组(矩阵)
2)对数组进行函数运算
3)数值积分
4)线性代数运算
5)傅里叶变换
6)随机数产生
NumPy是在1995年诞生的Python库Numeric的基础上建立的。但真正促使NumPy的发行的是Python的SciPy库。
SciPy是2001年发行的一个类似于Matlab,Maple,Mathematica等数学计算软件的Python库,它实现里面的大多数功能。
但SciPy中并没有合适的类似于Numeric中的对于基础的数据对象处理的功能。于是,SciPy的开发者将SciPy中的一部分和Numeric的设计思想结合,在2005年发行了NumPy。

NumPy基本对象

标准的Python中用list保存值,可以当作数组使用,但因为列表中的元素可以是任何对象,所以浪费了CPU运算时间和内存。
为了弥补这些缺陷。它提供了两种基本的对象:
ndarray:全称(n-dimensional array object)是储存单一数据类型的多维数组。
ufunc:全称(universal function object)它是一种能够对数组进行处理的函数。

安装Numpy

开发环境中

Anaconda和Pycharm等开发环境已经安装了NumPy

原生python安装

pip install numpy

ndarray

普通矩阵
NumPy中的核心对象是ndarray。
ndarray可以看成数组,类似于R语言的向量或者矩阵。
NumPy里面所有的函数都是围绕ndarray展开的。

a=np.array([1,2,3,4])
b=np.array((1,2,3,4))
c=np.array([[1,2,3,4],[5,6,7,8]])

ndarray对维数没有限制
[]从内到外分别为第0轴,第1轴,第2轴。
c第0轴长度为2,第1轴长度为4.

特殊矩阵
NumPy提供了专门用于生成ndaarray的函数,提高了创建ndarray的速度

a=np.arange(0,1,0.1)#0-1,步长0.1
b=np.linspace(0,1,10)#0-1,等分成10分
c=np.linspace(0,1,10,endpoint=False)#0-0.9,等分成10分
d=np.logspace(0,2,5)#10的0-2次幂,等分成5分


创建空矩阵

np.empty((2,3),np.int)#创建2*3的整形空矩阵,只分配内存
np.zeros(4,np.int)#创建长度为4,值全部为0的矩阵
np.full(4,np.pi)#创建长度为4,值全部为pi的矩阵


元素类型
ndarray的元素具有相同的元素类型。常用的有int,float,complex(复数)

a=np.array([1,2,3,4],dtype=float)
a.dtype

shape属性
ndarray的shape属性用来获得它的形状,也可以自己指定。

c=np.array([1,2,3,4],[4,5,6,7],[7,8,9,10])
c.shape

a=np.array([1.2.3.4])
d=a.reshape((2,2))


注:形状改变时需要注意元素个数

当不确定行数或列数使,可以使用-1表示

d=np.reshape((-1,1))#转化为n行1列的矩阵

ndarray的切片
darray的切片和list是一样的

a=np.arange(10)
a[5]
a[3:5]
a[:5]
a[:-1]
a[1:-1:2]
a[::-1]
a[5:1:-1]

可以通过切片对ndarray中的元素进行更改

a[2:4]=100,101


ndarray通过切片产生一个新的数组b,b和a共享同一块数据存储空间
如果想改变这种情况,我们可以用列表对数组元素切片或使用copy函数

b=a[[1,2,3]]#获取下标为1,2,3的元素组成b

b=a[:].copy()

多维数组的切片

a=np.arange(0,60,10).reshape(-1,1)+np.arange(0,6)


如果我们想创立原数组的副本,我们可以用整数元组,列表,整数数组,布尔数组进行切片。

以上是关于数据挖掘与机器学习课程学习笔记——2的主要内容,如果未能解决你的问题,请参考以下文章

数据挖掘与机器学习课程学习笔记——1

学习笔记1:《机器学习》第二章 模型评估与选择

郑捷《机器学习算法原理与编程实践》学习笔记(第七章 预测技术与哲学)7.1 线性系统的预测

机器学习基础教程笔记---特征工程

学习笔记 链接

Python3《机器学习实战》学习笔记