向量化

Posted fromzore

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了向量化相关的知识,希望对你有一定的参考价值。

有这么一件事情,比如说在梯度下降过程中我们需要不断地调整θ的值来完成梯度下降,可是使用循环会很慢,因为我们现在的计算机大部分都是SIMD也就是单指令流多数据流。如果使用for循环的话,那么之一条指令的数据流就是for循环里所规定的,并没有进行并行运算,没有充分运用计算机资源。然而,在深度学习(deeplearning)里,我们常常需要进行很多的梯度下降,等等之类需要循环的,使用显式的循环会让运算速度十分的缓慢。

想要充分的利用计算机的并行性,我们要学会使用向量化。在Python的numpy模块,向量化得到了充分的展现,下面是一个例子。

import time
import numpy as np

a=np.random.rand(1000000)#产生一个有1000000个数的随机矩阵
b=np.random.rand(1000000)
#这部分使用的是向量化
tic=time.time()
c=np.dot(a,b)
toc=time.time()

print(c)
print("向量化:"+str(1000*(toc-tic))+"ms")
#这部分使用的是显式的循环
c=0
tic=time.time()
for i in range(1000000):
    c+=a[i]*b[i]
toc=time.time()

print(c)
print("循环:"+str(1000*(toc-tic))+"ms")

这个代码得结果是这样的

技术分享图片

两个计算的结果是差不多的,但是向量化充分利用了cpu进行并行化运算,几乎没有用多少时间,循环却用了400毫秒。

所以我们一定要学会使用向量。

 

以上是关于向量化的主要内容,如果未能解决你的问题,请参考以下文章

除了 gcc 还都有哪些编译器可以向量化代码?

向量化代码并从 pytorch 代码中删除嵌套循环

向量化

PG 向量化引擎--1

如何使用向量化代码从 MATLAB 中的两个向量生成所有对?

如何矢量化这个 python 代码?