python数据结构:numpy

Posted 大数据开发程序猿

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了python数据结构:numpy相关的知识,希望对你有一定的参考价值。

一、 numpy概述

numpy(Numerical Python)提供了python对多维数组对象ndarray(应该是N-dimension array)的支持,具有矢量运算能力,快速、节省空间。numpy支持高级大量的维度数组与矩阵运算,此外也针对数组运算提供大量的数学函数库。

二、实操

1. 创建ndarray数组

ndarray:N维数组对象(矩阵),所有元素必须是相同类型。
ndarray属性:ndim属性,表示维度个数;shape属性,表示各维度大小;dtype属性,表示数据类型。

2.生成指定维度的随机数组

  (1)生成一个3行4列的随机数组,然后计算数组的各个属性

# 生成指定维度的随机数组
data = np.random.rand(3,4) #随机生成一个3行4列的随机数组
print(data)
print(type(data))   #数据结构是:<class \'numpy.ndarray\'>

  [[0.9866426 0.54835475 0.69859764 0.32483656]
  [0.27492952 0.23119927 0.97028605 0.08145471]
  [0.28869387 0.2712937 0.91773528 0.95094582]]

 

# 打印出数组的各个属性
print(\'数组的维数\',data.ndim) #number of dimension 数组的维数 2
print(\'数组的大小\',data.shape) #描述数组各维度的大小 (3,4)
print(\'数据类型\',data.dtype) #描述数组的数据类型 float

  (2)将列表转换为np.array形式

# 将list转换为二维数组
list = range(0,10)
data = np.array(list)   #实现将python列表的数据结构转换为np的array的数据结构
print(data)   #[0 1 2 3 4 5 6 7 8 9]
print(type(data))   #<class \'numpy.ndarray\'>
print(data.ndim)   #1
print(data.shape)   #(10,)
print(data.dtype)   #int32

  (3)将嵌套序列转换为ndarray的形式

#将嵌套序列转换为ndarray
l1 = [range(10),range(10)]
data = np.array(l1)
print(\'数据类型\',type(data))
print(\'数据的维度的大小为:\',data.shape)
print(\'数组的维数为:\',data.ndim)

  (4)np.zeros(shape, dtype=float, order=\'C\')   #注意这里shape是一个元组,对于其他的几个数据结构同理

#np.zeros np.ones 和np.empty
#np.zeros
zeros_arr = np.zeros((3,4),dtype=float)   #生成一个3行4列的全0数组 ,其中的数据类型是int
print(\'zeros_arr\',zeros_arr)

ones_arr = np.ones((3,4),dtype=float)    #生成一个3行4列的全1数组数据类型为float类型
print(\'ones_arr\',ones_arr)

empty_arr = np.empty((3,4))
print(\'empty_arr\',empty_arr)

empty_int_arr = np.empty((3,4),dtype=int)
print(\'empty_int_arr\',empty_int_arr)

  (5)np.arange()

print(np.arange(10))   #生成0到9的数组
print(type(np.arange(10)))   #数据类型是numpy.ndarray的数据类型

  (6)生成一个全0的矩阵

zero_float_arr = np.zeros((3,4),dtype=np.float)
print(zero_float_arr)
print(type(zero_float_arr))   #数组的数据类型是numpy.ndarray
print(zero_float_arr.dtype)    #

# 使用astype做数据类型的转换
zero_int_arr = zero_float_arr.astype(np.int)
print(type(zero_int_arr))
print(zero_int_arr.dtype)

  (7)矢量的计算

arr = np.array([[1,2,3],[4,5,6]])  #生成一个列表,使用np.array方法将一个列表转换为np.array
print(arr)   
print(type(arr))   #打印出数组的数据类型
print(arr.dtype)  #打印出数据类型

  (8)矩阵的运算

#产生一个2行3列的二维矩阵
arr = np.array([[1,2,3],[4,5,6]])
print(arr)
print(type(arr))
print(arr.dtype)

# 将矩阵进行相乘的运算,这个地方要注意,直接将矩阵进行乘法运算,是将矩阵中元素进行位置上的乘法运算
print(\'矩阵中的元素相乘arr*arr\',arr*arr)

#将矩阵进行加法的运算
print(\'arr+arr\',arr+arr)

# 实现矢量与标量的运算,矢量与标量运算的时候需要进行广播
print(\'1/arr=\\n\',1./arr)   #矩阵的除法
print(\'2*arr=\\n\',2*arr)

  (9)数组的切片操作

arr1 = np.arange(10)   #产生一个10个元素的数组
print(type(arr1))    #数据结构仍然是numpy.ndarray
print(arr1.dtype)   #元素的数据类型仍然是int32类型
print(arr1)     #
print(arr1[2:5])   #切片操作 ,左闭右开的切片



arr2 = np.arange(12).reshape(3,4)   #产生一个3行4列的二维数组
print(arr2)
print(arr2[1]) #切片操作,切出数组中第一行的数据,出数组的第一行
print(arr2[0:2,1:]) #切片操作,切除第0行第一行以及第一列之后的数组
print(arr2[:,1:3]) #切片操作,切出所有的行,以及第1列,第2列的数据

  (10)条件索引

#找出data_arr中2015年以后的数据
data_arr = np.random.rand(3,3)   # 创建一个3行3列的二维随机数组
print(\'data_arr \\n\',data_arr)

year_arr = np.array([[2000,2001,2000],[2005,2002,2009],[2001,2003,2010]])
print(\'year_arr \\n\',year_arr)

filtered_arr=data_arr[year_arr>2005]
print(\'filtered_arr \\n\',filtered_arr)

#多条件索引
#多个条件索引
filtered_arr = data_arr[(year_arr<=2005) & (year_arr%2==0)] #打印出年份小于2005年并且为偶数年份的数据
# print(year_arr[(year_arr<=2005) & (year_arr%2==0)])
print(\'filtered_arr\',filtered_arr)

  (11)二维矩阵的转置

arr1 = np.random.rand(2,3)  #生成一个2行3列的二维数组
print(\'arr1=\\n\',arr1)
print(\'arr1数组的转置为:\\n\',arr1.transpose())

  (12)三维矩阵及其转置

#3维矩阵
arr3d = np.random.rand(2,3,4)
print(\'arr3d=\\n\',arr3d)
print(\'================================\')
print(arr3d.transpose((1,0,2)))

  (13)常见运算(np.around、np.floor、np.ceil、np.where)

    ①p.ceil 函数返回输入值的上限,就是向上取整,即对于输入 x ,返回最小的整数 i ,使得 i> = x。

arr = np.random.randn(2,3)   #生成量行3列的随机数组
print(arr)

    ②np.floor 返回不大于输入参数的最大整数。 即对于输入值 x ,将返回最大的整数 i ,使得 i <= x。 注意在Python中,向下取整总是从 0 舍入。

print(\'np.floor(arr)=\\n\',np.floor(arr))

    ③np.rint()是根据四舍五入取整

print(\'np.rint(arr)=\\n\',np.rint(arr))

    ④np.isnan(arr)是判断数组的每个元素是不是NaN数据类型

print(\'np.isnan(arr)=\\n\',np.isnan(arr))

    ⑤np.where(condition, x, y),满足条件(condition),输出x,不满足输出y。

#np.where
arr1 = np.random.rand(3,4)
print(arr1)
print(np.where(arr1>0.5,1,-1))

   14.数组求和

arr1 = np.random.rand(5,2)
print(\'arr1=\\n\',arr1)
print(\'np.sum(arr1)=\\n\',np.sum(arr1))  #对数组进行求和
print(\'np.sum(arr1),axis=0\',np.sum(arr1,axis=0))   #在列的方向进行求和
print(\'np.sum(arr1),axis=1\',np.sum(arr1,axis=1))   #在行的方向进行求和

   15.

    np.array.any()是或操作,将np.array中所有元素进行或操作,然后返回True或False

    np.array.all()是与操作,将np.array中所有元素进行与操作,然后返回True或False

arr1 = np.random.randn(2,3)
print(arr1)
print(np.any(arr1>0))
print(np.all(arr1>0))

[[-0.03475223 0.21371993 0.84167799]
[ 1.60330052 0.02812848 1.37971765]]
True
False

    16unique操作

arr1 = np.array([[1,2,1],[2,3,4]])
print(\'arr1\',arr1)
print(\'np.unique(arr1)\',np.unique(arr1))

 

以上是关于python数据结构:numpy的主要内容,如果未能解决你的问题,请参考以下文章

《Python机器学习及实践》----无监督学习之数据聚类

《Python机器学习及实践》----无监督学习之数据聚类

Python数据分析numpy入门-------numpy100题练习

Python数据分析numpy入门-------numpy100题练习

Numpy学习:《Python数据分析基础教程NumPy学习指南第2版》中文PDF+英文PDF+代码

python 用于数据探索的Python代码片段(例如,在数据科学项目中)