Numpy学习

Posted 小葵花幼儿园园长

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Numpy学习相关的知识,希望对你有一定的参考价值。

目录

 

一、Numpy介绍

1.为什么用numpy

二、Numpy学习

1.numpy属性

2.创建array

3. 基础运算

一维基础

多维:

4.索引

5.array合并

6.array分割

7. 浅拷贝和深拷贝


一、Numpy介绍

1.为什么用numpy

  • 运算速度快:numpy 和 pandas 都是采用 C 语言编写, pandas 又是基于 numpy, 是 numpy 的升级版本。
  • 消耗资源少:采用的是矩阵运算,会比 python 自带的字典或者列表快好多

二、Numpy学习

1.numpy属性

  • ndim:维度
  • shape:行数和列数
  • size:元素个数
import numpy as np

array = np.array([[1,2,3],[2,3,4]])  #列表转化为矩阵
print(array)

"""
array([[1, 2, 3],
       [2, 3, 4]])
"""

print('number of dim:',array.ndim)  # 维度
# number of dim: 2

print('shape :',array.shape)    # 行数和列数
# shape : (2, 3)

print('size:',array.size)   # 元素个数
# size: 6

 

2.创建array

关键字:

  • array:创建数组
  • dtype:指定数据类型
  • zeros:创建数据全为0
  • ones:创建数据全为1
  • empty:创建数据接近0
  • arrange:按指定范围创建数据
  • linspace:创建线段

创建数组:

a = np.array([2,23,4])  # list 1d
print(a)
# [2 23 4]

指定数据:

a = np.array([2,23,4],dtype=np.int)
print(a.dtype)
# int 64

a = np.array([2,23,4],dtype=np.int32)
print(a.dtype)
# int32

a = np.array([2,23,4],dtype=np.float)
print(a.dtype)
# float64

a = np.array([2,23,4],dtype=np.float32)
print(a.dtype)
# float32

创建特定数据:

a = np.array([[2,23,4],[2,32,4]])  # 2d 矩阵 2行3列

print(a)
"""
[[ 2 23  4]
 [ 2 32  4]]
"""


# 全零数组
a = np.zeros((3,4)) # 数据全为0,3行4列

"""
array([[ 0.,  0.,  0.,  0.],
       [ 0.,  0.,  0.,  0.],
       [ 0.,  0.,  0.,  0.]])
"""

# 创建全一数组, 同时也能指定这些特定数据的 dtype:
a = np.ones((3,4),dtype = np.int)   # 数据为1,3行4列

"""
array([[1, 1, 1, 1],
       [1, 1, 1, 1],
       [1, 1, 1, 1]])
"""

# 创建全空数组, 其实每个值都是接近于零的数:
a = np.empty((3,4)) # 数据为empty,3行4列

"""
array([[  0.00000000e+000,   4.94065646e-324,   9.88131292e-324,
          1.48219694e-323],
       [  1.97626258e-323,   2.47032823e-323,   2.96439388e-323,
          3.45845952e-323],
       [  3.95252517e-323,   4.44659081e-323,   4.94065646e-323,
          5.43472210e-323]])
"""

# 用 arange 创建连续数组:
a = np.arange(10,20,2) # 10-19 的数据,2步长

"""
array([10, 12, 14, 16, 18])
"""

# 使用 reshape 改变数据的形状
a = np.arange(12).reshape((3,4))    # 3行4列,0到11

"""
array([[ 0,  1,  2,  3],
       [ 4,  5,  6,  7],
       [ 8,  9, 10, 11]])
"""

# 用 linspace 创建线段型数据:
a = np.linspace(1,10,20)    # 开始端1,结束端10,且分割成20个数据,生成线段

"""
array([  1.        ,   1.47368421,   1.94736842,   2.42105263,
         2.89473684,   3.36842105,   3.84210526,   4.31578947,
         4.78947368,   5.26315789,   5.73684211,   6.21052632,
         6.68421053,   7.15789474,   7.63157895,   8.10526316,
         8.57894737,   9.05263158,   9.52631579,  10.        ])
"""

# 同样也能进行 reshape 工作:
a = np.linspace(1,10,20).reshape((5,4)) # 更改shape

"""
array([[  1.        ,   1.47368421,   1.94736842,   2.42105263],
       [  2.89473684,   3.36842105,   3.84210526,   4.31578947],
       [  4.78947368,   5.26315789,   5.73684211,   6.21052632],
       [  6.68421053,   7.15789474,   7.63157895,   8.10526316],
       [  8.57894737,   9.05263158,   9.52631579,  10.        ]])
"""

 

3. 基础运算

一维基础

加减乘除:

import numpy as np

a=np.array([10,20,30,40])   # array([10, 20, 30, 40])
b=np.arange(4)              # array([0, 1, 2, 3])


# 加减
c=a-b  # array([10, 19, 28, 37])
c=a+b   # array([10, 21, 32, 43])

c=b**2  # array([0, 1, 4, 9])

# 三角
c=10*np.sin(a)  
# array([-5.44021111,  9.12945251, -9.88031624,  7.4511316 ])

# 逻辑判断
print(b<3)  
# array([ True,  True,  True, False], dtype=bool)


多维:

a=np.array([[1,1],[0,1]])
b=np.arange(4).reshape((2,2))

print(a)
# array([[1, 1],
#       [0, 1]])

print(b)
# array([[0, 1],
#       [2, 3]])

# 点乘
c_dot = np.dot(a,b)
# array([[2, 4],
#       [2, 3]])

c_dot_2 = a.dot(b)
# array([[2, 4],
#       [2, 3]])

求和、最大、最小:

import numpy as np
a=np.random.random((2,4))
print(a)

# array([[ 0.94692159,  0.20821798,  0.35339414,  0.2805278 ],
#       [ 0.04836775,  0.04023552,  0.44091941,  0.21665268]])

np.sum(a)   # 4.4043622002745959
np.min(a)   # 0.23651223533671784
np.max(a)   # 0.90438450240606416



print("a =",a)
# a = [[ 0.23651224  0.41900661  0.84869417  0.46456022]
# [ 0.60771087  0.9043845   0.36603285  0.55746074]]

# axis为1.将会以行作为查找单元
print("sum =",np.sum(a,axis=1))
# sum = [ 1.96877324  2.43558896]

# 当axis的值为0的时候,将会以列作为查找单元
print("min =",np.min(a,axis=0))
# min = [ 0.23651224  0.41900661  0.36603285  0.46456022]

print("max =",np.max(a,axis=1))
# max = [ 0.84869417  0.9043845 ]

根据索引:

import numpy as np
A = np.arange(2,14).reshape((3,4)) 

# array([[ 2, 3, 4, 5]
#        [ 6, 7, 8, 9]
#        [10,11,12,13]])

# argmin() 和 argmax() 两个函数分别对应着求矩阵中最小元素和最大元素的索引。
print(np.argmin(A))    # 0
print(np.argmax(A))    # 11

# 求均值
print(np.mean(A))        # 7.5
print(A.mean())          # 7.5

print(np.average(A))     # 7.5

# 累积函数类似
# cumsum()生成的每一项矩阵元素均是从原矩阵首项累加到对应项的元素之和。
print(np.cumsum(A)) 

# [2 5 9 14 20 27 35 44 54 65 77 90]

# nonzore() 返回非零元素的索引
print(np.nonzero(A))    

# (array([0,0,0,0,1,1,1,1,2,2,2,2]),array([0,1,2,3,0,1,2,3,0,1,2,3]))


# 排序
import numpy as np
A = np.arange(14,2, -1).reshape((3,4)) 

# array([[14, 13, 12, 11],
#       [10,  9,  8,  7],
#       [ 6,  5,  4,  3]])

print(np.sort(A))    

# array([[11,12,13,14]
#        [ 7, 8, 9,10]
#        [ 3, 4, 5, 6]])

# 转置
print(np.transpose(A))    
print(A.T)

# array([[14,10, 6]
#        [13, 9, 5]
#        [12, 8, 4]
#        [11, 7, 3]])
# array([[14,10, 6]
#        [13, 9, 5]
#        [12, 8, 4]
#        [11, 7, 3]])


# 切片 clip(Array,Array_min,Array_max)
# 最小值最大值则用于让函数判断矩阵中元素是否有比最小值小的或者比最大值大的元素,并将这些指定的元素转换为最小值或者最大值
print(A)
# array([[14,13,12,11]
#        [10, 9, 8, 7]
#        [ 6, 5, 4, 3]])

print(np.clip(A,5,9))    
# array([[ 9, 9, 9, 9]
#        [ 9, 9, 8, 7]
#        [ 6, 5, 5, 5]])

 

4.索引

基础操作:

import numpy as np

# 一维索引
A = np.arange(3,15)

# array([3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14])
         
print(A[3])    # 6


# 二维索引
A = np.arange(3,15).reshape((3,4))
"""
array([[ 3,  4,  5,  6]
       [ 7,  8,  9, 10]
       [11, 12, 13, 14]])
"""
  
# A[2]对应的就是矩阵A中第三行(从0开始算第一行)的所有元素。      
print(A[2])         
# [11 12 13 14]

# 找到具体的单个元素
print(A[1][1])      # 8

print(A[1, 1])      # 8

# 也可以对一定范围内的元素进行切片
print(A[1, 1:3])    # [8 9]

展开函数:

import numpy as np
A = np.arange(3,15).reshape((3,4))
         
print(A.flatten())   
# array([3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14])

for item in A.flat:
    print(item)
    
# 3
# 4
……
# 14

5.array合并

import numpy as np
A = np.array([1,1,1])
B = np.array([2,2,2])

# 上下合并 vstack()
print(np.vstack((A,B)))    # vertical stack
"""
[[1,1,1]
 [2,2,2]]
"""

C = np.vstack((A,B))      
print(A.shape,C.shape)

# (3,) (2,3)

# 左右合并 hstack()
D = np.hstack((A,B))       # horizontal stack

print(D)
# [1,1,1,2,2,2]

print(A.shape,D.shape)
# (3,) (6,)


# 多个矩阵或者是序列的合并 concatenate()
C = np.concatenate((A,B,B,A),axis=0)

print(C)
"""
array([[1],
       [1],
       [1],
       [2],
       [2],
       [2],
       [2],
       [2],
       [2],
       [1],
       [1],
       [1]])
"""

D = np.concatenate((A,B,B,A),axis=1)

print(D)
"""
array([[1, 2, 2, 1],
       [1, 2, 2, 1],
       [1, 2, 2, 1]])
"""


6.array分割

import numpy as np

A = np.arange(12).reshape((3, 4))
print(A)
"""
array([[ 0,  1,  2,  3],
    [ 4,  5,  6,  7],
    [ 8,  9, 10, 11]])
"""


# 纵向分割 axis=1 代表说是列  2代表分成两块
print(np.split(A, 2, axis=1))
"""
[array([[0, 1],
        [4, 5],
        [8, 9]]), array([[ 2,  3],
        [ 6,  7],
        [10, 11]])]
"""

# 横向分割 axis= 0 代表说是行 3代表分成3快
print(np.split(A, 3, axis=0))

# [array([[0, 1, 2, 3]]), array([[4, 5, 6, 7]]), array([[ 8,  9, 10, 11]])]

# 不对等的分块
print(np.array_split(A, 3, axis=1))
"""
[array([[0, 1],
        [4, 5],
        [8, 9]]), 
array([[ 2],
        [ 6],
        [10]]), 
array([[ 3],
        [ 7],
        [11]])]
"""


# 横向分割 和 纵向分割
print(np.vsplit(A, 3)) #等于 print(np.split(A, 3, axis=0))

# [array([[0, 1, 2, 3]]), array([[4, 5, 6, 7]]), array([[ 8,  9, 10, 11]])]


print(np.hsplit(A, 2)) #等于 print(np.split(A, 2, axis=1))
"""
[array([[0, 1],
       [4, 5],
       [8, 9]]), array([[ 2,  3],
        [ 6,  7],
        [10, 11]])]
"""

7. 浅拷贝和深拷贝

import numpy as np


a = np.arange(4)
# array([0, 1, 2, 3])

# 浅拷贝
b = a
c = a
d = b

# 改变a中的第一个值,b c d的第一个值也会发生改变
a[0] = 11
print(a)
# array([11,  1,  2,  3])


# 确认a b c 是否相等
b is a  # True
c is a  # True
d is a  # True


# 同样改变d的值, a b c也会发生改变
d[1:3] = [22, 33]   # array([11, 22, 33,  3])
print(a)            # array([11, 22, 33,  3])
print(b)            # array([11, 22, 33,  3])
print(c)            # array([11, 22, 33,  3])


# 深拷贝 copy()
b = a.copy()    # deep copy
print(b)        # array([11, 22, 33,  3])
a[3] = 44

# a b 已经没有联系了
print(a)        # array([11, 22, 33, 44])
print(b)        # array([11, 22, 33,  3])

 

以上是关于Numpy学习的主要内容,如果未能解决你的问题,请参考以下文章

Numpy学习:《Python数据分析基础教程NumPy学习指南第2版》中文PDF+英文PDF+代码

《Python机器学习及实践》----无监督学习之数据聚类

《Python机器学习及实践》----无监督学习之数据聚类

Numpy学习笔记

Numpy学习一:array数组对象

Numpy学习练习代码 ——