机器学习之numpy库中常用的函数介绍
Posted
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了机器学习之numpy库中常用的函数介绍相关的知识,希望对你有一定的参考价值。
1. mat()
mat()与array的区别:
mat是矩阵,数据必须是2维的,是array的子集,包含array的所有特性,所做的运算都是针对矩阵来进行的。
array是数组,数据可以是多维的,所做的运算都是针对数组来进行的
(1) 数据能表示的维度不同,array数据可以是多维的,mat的数据必须是2维的。
array能表示超过2维的数据,而mat不能:
对于2维的数据,array和mat的表示形式完全一样(但运算不一样):
(2) 把array转换为mat
(3) matrix 和 array 都可以通过objects后面加.T 得到其转置。但是matrix objects 还可以在后面加 .H 得到共轭矩阵, 加 .I 得到逆矩阵。
(4) array遵从逐个元素的运算,array的类型的a和b的a*b的运算,相当与MATLAB中的a.*b的运算。
数组a,b的点乘乘法运算a*b (逐个元素的运算):
数组a,b的矩阵乘法运算:
相当于矩阵A,B的矩阵乘法运算:
(5) **运算不一样
对于array a,a**2运算相当于对于a的元素逐个求平方:
对于mat a,a**2运算相当于矩阵相乘a*a:
2. list和array的区别
(1) list是python的内置数据类型,list中的数据类型不必相同,主要用来作索性,可以通过索引查找数值,但不能对整个列表进行数值运算
(2) array的中的类型必须全部相同(同属于int,float,duoble)才能进行数组间的运算,否则也只能作索引:
3. shape() 读取矩阵的各个维度的长度
(1)shape() 返回的是各个维度的长度的列表:
(2)shape[n ]表示获取第n个维度的长度
4. random.uniform()方法
uniform(x,y): 随机产生一个在[x, y]范围内的实数,返回一个浮点数。
5. mean()方法
mean()方法为求平均值的方法:
mean(a, axis=None, dtype=None, out=None, skipna=False, keepdims=False)
a: 输入的数组,array类型
axis: None:计算数组中的所有值的平均值
=0:以列为单位计算数组中每一列的所有值的平均值;
=1:以行为单位计算数组中每一行的所有值的平均值
dtype: 为指定数组中的元素的类型,默认为float64
out: 如果提供,则为计算的输出结果保存的数组,大小要和输出结果的数组大小相同
skipna: 如果设置为true,则计算时跳过为NA的值
keepdims: 如果设置为true,输出结果将保持为1的维度,即计算结果放在一个数组内
6. tile() 方法
tile英文单词意思:拼贴。tile(A, n)功能:将数组A重复n次,构成一个新的数组。
A的类型:array, list, tuple, dict, matrix,int, string, float,bool
n的类型: tuple,list, dict, array, int,bool,不可以是float, string, matrix
(1) 当n为一个整数时
(2) 当n为list,tuple
(3) 当A的维度 < n的长度时
tile(A, n)将A中的所有元素作为单元,按n变成一个新的数组,以上为例子。
(4) 当A的维度 > n的长度时
n的长度不足为A的维度,即在n的前面加上(A的维度-n的长度),变成与A的维度相同的长度,再进行重复:
以上的a的维度为2,n的长度为1,n自动补充为[2-1, 3] =[1, 3], 与以下等效:
7. argsort()方法
argsort(a):对数组或元组a进行升序排序, 返回的是升序之后的各个元素在原来a未升序之前的下标,即返回升序之后对应的下标数组。
降序排序:
(1) 获取升序排列之后的最后一个下标
(2) 或者使用argsort(-a)进行降序排列,其中a只能是含相同数据类型的数组,不能是列表
8. transpose( )方法
装置,可以装置任何类型mat,list,array,当类=类型为mat的时候,等同于A.T
9. sum
sum(a, axis=None, dtype=None, out=None, skipna=False, keepdims=False)
a: 输入的数组,array类型
axis: None:计算数组中的所有值的和
=0:以列为单位计算数组中每一列的所有值的和;
=1:以行为单位计算数组中每一行的所有值的和
dtype: 为指定数组中的元素的类型,默认为float64
out: 如果提供,则为计算的输出结果保存的数组,大小要和输出结果的数组大小相同
skipna: 如果设置为true,则计算时跳过为NA的值
keepdims: 如果设置为true,输出结果将保持为1的维度,即计算结果放在一个数组内
10. get()方法
dict.get(key, default=None) key -- 字典中要查找的键。default -- 如果指定键的值不存在时,返回该默认值。
11. operator.itemgetter ()
operator.itemgetter(n)定义了一个用来获取对象第n个域数据的函数。
12. iteritems()
返回字典的一个迭代器。返回一个可以调用的对象(可以从操作对象中提取item)
13. sorted() 方法
对list或者iterable进行排列
sorted(iterable, cmp, key, reverse)
iterable指定要排序的list或者iterable,
cmp为函数,指定排序时进行比较的函数,可以指定一个函数或者lambda函数,
key为函数,指定取待排序元素的哪一个域进行排序,
reverse默认为false(升序排列),定义为True时将按降序排列。
与sort区别的是,sort会改变原来对象的顺序:
ndarray.sort(axis=-1, kind=‘quicksort‘, order=None)
axis:排序的维度,0表示按行,1表示按列
kind:排序的算法,提供了快排、混排、堆排:’quicksort’, ‘mergesort’, ‘heapsort’
order:排列的顺序
以上是关于机器学习之numpy库中常用的函数介绍的主要内容,如果未能解决你的问题,请参考以下文章