为什么深度学习和神经网络需要GPU？

Posted 2021-04-03 AI干货知识库

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了为什么深度学习和神经网络需要GPU？相关的知识，希望对你有一定的参考价值。

研究深度学习和神经网络大都离不开GPU，在GPU的加持下，我们可以更快的获得模型训练的结果。使用GPU和使用CPU的差别在哪里？为什么需要GPU？

一个关于使用Pytorch的教程中对这个问题进行了一个很好的解释，本文内容主要转载自： https://deeplizard.com/learn/video/6stDhEA0wFQ

为了更好地切题，本文对其内容做了一些删改，并增加了GPU与CPU原理结构的部分，此部分是从看到的

全文较长可以直接拉到末尾看一句话总结

CPU和GPU是什么

GPU（Graphics processing unit），中文全称图形处理器，我们听说的更多的CPU全称是central processing unit，中央处理器。

CPU是电子计算机的主要设备之一，电脑中的核心配件。其功能主要是解释计算机指令以及处理计算机软件中的数据。CPU是计算机中负责读取指令，对指令译码并执行指令的核心部件。
GPU(图形处理器)是图形系统结构的重要元件，是连接计算机和显示终端的纽带。一个光栅显示系统离不开图形处理器(GPU)。应该说有显示系统就有图形处理器，但是早期的显卡只包含简单的存储器和帧缓冲区，它们实际上只起了一个图形的存储和传递作用，一切操作都必须由CPU来控制。这对于文本和一些简单的图形来说是足够的，但是当要处理复杂场景特别是一些真实感的三维场景，单靠这种系统是无法完成任务的。所以后来发展的显卡都有图形处理的功能。它不单单存储图形，而且能完成大部分图形功能，这样就大大减轻了CPU的负担，提高了显示能力和显示速度。
图形处理器可单独与专用电路板以及附属组件组成显卡，或单独一片芯片直接内嵌入到主板上，或者内置于主板的北桥芯片中，现在也有内置于CPU上组成SoC的。个人电脑领域中，在2007年，90%以上的新型台式机和笔记本电脑拥有嵌入式绘图芯片，但是在性能上往往低于不少独立显卡。

GPU的计算速度比CPU快得多。然而，情况并不总是如此。GPU相对于CPU的速度取决于执行的计算类型。最适合GPU的计算类型是可以并行完成的计算。

并行计算

并行计算是一种将特定计算分解成可以同时进行的独立的较小计算的计算方式。然后重新组合或同步计算结果，形成原来较大计算的结果。

更大的任务可以分解成的任务数量取决于特定硬件上包含的内核数量。核心是在给定处理器中实际执行计算的单元，CPU通常有4个、8个或16个核心，而GPU可能有数千个。还有其他重要的技术规范，但是这个描述是用来驱动总体思想的。（此处涉及的原理在）

有了这些工作知识，我们可以得出结论，并行计算是使用GPU完成的，我们还可以得出结论，最适合使用GPU解决的任务是可以并行完成的任务。如果计算可以并行完成，我们可以使用并行编程方法和GPU加速计算。

神经网络是高度并行的（embarrassingly parallel）

现在让我们把注意力转向神经网络，看看为什么GPU在深度学习中被如此频繁地使用。我们刚刚看到，GPU非常适合并行计算，而关于GPU的这个事实就是为什么深度学习要使用它们。神经网络是高度并行的（embarrassingly parallel）。

在并行计算中，高度并行任务是指将整个任务分割成一组较小的任务以并行计算的任务。高度并行任务是那些很容易看到一组小任务彼此独立的任务。

神经网络结构

由于这个原因，神经网络高度并行。我们用神经网络做的许多计算都可以很容易地分解成更小的计算，这样小的计算集就不会相互依赖。一个这样的例子就是卷积。