机器学习之numpy库中常用的函数介绍

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了机器学习之numpy库中常用的函数介绍相关的知识,希望对你有一定的参考价值。

1. mat()

mat()与array的区别:

mat是矩阵,数据必须是2维的,是array的子集,包含array的所有特性,所做的运算都是针对矩阵来进行的。

array是数组,数据可以是多维的,所做的运算都是针对数组来进行的

(1) 数据能表示的维度不同,array数据可以是多维的,mat的数据必须是2维的。

array能表示超过2维的数据,而mat不能:

技术分享

对于2维的数据,array和mat的表示形式完全一样(但运算不一样):

技术分享

(2) 把array转换为mat

技术分享

(3) matrix 和 array 都可以通过objects后面加.T 得到其转置。但是matrix objects 还可以在后面加 .H 得到共轭矩阵, 加 .I 得到逆矩阵。

技术分享

技术分享

(4) array遵从逐个元素的运算,array的类型的a和b的a*b的运算,相当与MATLAB中的a.*b的运算。

数组a,b的点乘乘法运算a*b (逐个元素的运算):

技术分享

数组a,b的矩阵乘法运算:

技术分享

相当于矩阵A,B的矩阵乘法运算:

技术分享

(5) **运算不一样

对于array a,a**2运算相当于对于a的元素逐个求平方:

技术分享

对于mat a,a**2运算相当于矩阵相乘a*a:

技术分享

2. list和array的区别

(1) list是python的内置数据类型,list中的数据类型不必相同,主要用来作索性,可以通过索引查找数值,但不能对整个列表进行数值运算

技术分享

但是可以进行+运算,表示的是两个列表的拼接:
技术分享

(2) array的中的类型必须全部相同(同属于int,float,duoble)才能进行数组间的运算,否则也只能作索引:

技术分享

技术分享

3. shape() 读取矩阵的各个维度的长度

(1)shape() 返回的是各个维度的长度的列表:

技术分享

技术分享

(2)shape[n ]表示获取第n个维度的长度

技术分享

技术分享

4. random.uniform()方法

uniform(x,y): 随机产生一个在[x, y]范围内的实数,返回一个浮点数。

技术分享

5. mean()方法

mean()方法为求平均值的方法:

mean(a, axis=None, dtype=None, out=None, skipna=False, keepdims=False)

a: 输入的数组,array类型

axis: None:计算数组中的所有值的平均值

=0:以列为单位计算数组中每一列的所有值的平均值;

=1:以行为单位计算数组中每一行的所有值的平均值

dtype: 为指定数组中的元素的类型,默认为float64

out: 如果提供,则为计算的输出结果保存的数组,大小要和输出结果的数组大小相同

skipna: 如果设置为true,则计算时跳过为NA的值

keepdims: 如果设置为true,输出结果将保持为1的维度,即计算结果放在一个数组内

技术分享

6. tile() 方法

tile英文单词意思:拼贴。tile(A, n)功能:将数组A重复n次,构成一个新的数组。

A的类型:array, list, tuple, dict, matrix,int, string, float,bool

n的类型: tuple,list, dict, array, int,bool,不可以是float, string, matrix

(1) 当n为一个整数时

技术分享

(2) 当n为list,tuple

技术分享

(3) 当A的维度 < n的长度时

tile(A, n)将A中的所有元素作为单元,按n变成一个新的数组,以上为例子。

(4) 当A的维度 > n的长度时

n的长度不足为A的维度,即在n的前面加上(A的维度-n的长度),变成与A的维度相同的长度,再进行重复:

技术分享

以上的a的维度为2,n的长度为1,n自动补充为[2-1, 3] =[1, 3], 与以下等效:

技术分享

7. argsort()方法

argsort(a):对数组或元组a进行升序排序, 返回的是升序之后的各个元素在原来a未升序之前的下标,即返回升序之后对应的下标数组。

技术分享

降序排序:

(1) 获取升序排列之后的最后一个下标

技术分享

(2) 或者使用argsort(-a)进行降序排列,其中a只能是含相同数据类型的数组,不能是列表

技术分享

8. transpose( )方法

装置,可以装置任何类型mat,list,array,当类=类型为mat的时候,等同于A.T

技术分享

9. sum

sum(a, axis=None, dtype=None, out=None, skipna=False, keepdims=False)

a: 输入的数组,array类型

axis: None:计算数组中的所有值的和

=0:以列为单位计算数组中每一列的所有值的和;

=1:以行为单位计算数组中每一行的所有值的和

dtype: 为指定数组中的元素的类型,默认为float64

out: 如果提供,则为计算的输出结果保存的数组,大小要和输出结果的数组大小相同

skipna: 如果设置为true,则计算时跳过为NA的值

keepdims: 如果设置为true,输出结果将保持为1的维度,即计算结果放在一个数组内

技术分享

10. get()方法

dict.get(key, default=None) key -- 字典中要查找的键。default -- 如果指定键的值不存在时,返回该默认值。

技术分享

11. operator.itemgetter ()

operator.itemgetter(n)定义了一个用来获取对象第n个域数据的函数。

技术分享

12. iteritems()

返回字典的一个迭代器。返回一个可以调用的对象(可以从操作对象中提取item)

技术分享

13. sorted() 方法

对list或者iterable进行排列

sorted(iterable, cmp, key, reverse)

iterable指定要排序的list或者iterable,

cmp为函数,指定排序时进行比较的函数,可以指定一个函数或者lambda函数,

key为函数,指定取待排序元素的哪一个域进行排序,

reverse默认为false(升序排列),定义为True时将按降序排列。

技术分享

与sort区别的是,sort会改变原来对象的顺序:

ndarray.sort(axis=-1, kind=‘quicksort‘, order=None)

axis:排序的维度,0表示按行,1表示按列

kind:排序的算法,提供了快排、混排、堆排:’quicksort’, ‘mergesort’, ‘heapsort’

order:排列的顺序

技术分享


以上是关于机器学习之numpy库中常用的函数介绍的主要内容,如果未能解决你的问题,请参考以下文章

Python 机器学习之开发环境

Python大数据与机器学习之NumPy初体验

机器学习之支持向量机:支持向量机的Python语言实现

机器学习之回归算法

机器学习之数学基础-微积分,概率论和矩阵

机器学习之sigmoid函数