深度学习平台你知道多少？

Posted 2022-01-06 卓晴

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了深度学习平台你知道多少？相关的知识，希望对你有一定的参考价值。

导读：近几年随着深度学习算法的发展，出现了许多深度学习框架。这些框架各有所长，各具特色。常用的开源框架有TensorFlow、Keras、Caffe、PyTorch、Theano、CNTK、MXNet、PaddlePaddle、Deeplearning4j、ONNX等。
作者：谢佳标
来源：大数据DT（ID：hzdashuju）

§01 框架总览

1.1 Tensorflow

框架名称：TensorFlow
主要维护方：Google
支持的语言：C++/Python/Java/R 等
GitHub源码地址：https://github.com/tensorflow/tensorflow

1.2 Keras

框架名称：Keras
主要维护方：Google
支持的语言：Python/R
GitHub源码地址：https://github.com/keras-team/keras

1.3 Caffe

框架名称：Caffe
主要维护方：BVLC
支持的语言：C++/Python/Matlab
GitHub源码地址：https://github.com/BVLC/caffe

1.4 Pytorch

框架名称：PyTorch
主要维护方：Facebook
支持的语言：C/C++/Python
GitHub源码地址：https://github.com/pytorch/pytorch

1.5 Theano

框架名称：Theano
主要维护方：UdeM
支持的语言：Python
GitHub源码地址：https://github.com/Theano/Theano

1.6 CNTK

框架名称：CNTK
主要维护方：Microsoft
支持的语言：C++/Python/C#/.NET/Java/R
GitHub源码地址：https://github.com/Microsoft/CNTK

1.7 MXNet

框架名称：MXNet
主要维护方：DMLC
支持的语言：C++/Python/R等
GitHub源码地址：https://github.com/apache/incubator-mxnet

1.8 PaddlePaddle

框架名称：PaddlePaddle
主要维护方：Baidu
支持的语言：C++/Python
GitHub源码地址：https://github.com/PaddlePaddle/Paddle/

1.9 Deeplearning4j

框架名称：Deeplearning4j
主要维护方：Eclipse
支持的语言：Java/Scala等
GitHub源码地址：https://github.com/eclipse/deeplearning4j

1.10 ONNX

框架名称：ONNX
主要维护方：Microsoft/ Facebook
支持的语言：Python/R
GitHub源码地址：https://github.com/onnx/onnx

下面开始对各框架进行概述，让读者对各个框架有个简单的认知，具体的安装及使用方法不在本文赘述。

§02 框架介绍

2.1 TensorFlow

谷歌的TensorFlow可以说是当今最受欢迎的开源深度学习框架，可用于各类深度学习相关的任务中。TensorFlow = Tensor + Flow，Tensor就是张量，代表N维数组；Flow即流，代表基于数据流图的计算。

TensorFlow是目前深度学习的主流框架，其主要特性如下所述。
TensorFlow支持Python、javascript、C ++、Java、Go、C＃、Julia和R等多种编程语言。
TensorFlow不仅拥有强大的计算集群，还可以在ios和android等移动平台上运行模型。
TensorFlow编程入门难度较大。初学者需要仔细考虑神经网络的架构，正确评估输入和输出数据的维度和数量。
TensorFlow使用静态计算图进行操作。也就是说，我们需要先定义图形，然后运行计算，如果我们需要对架构进行更改，则需要重新训练模型。选择这样的方法是为了提高效率，但是许多现代神经网络工具已经能够在学习过程中改进，并且不会显著降低学习速度。在这方面，TensorFlow的主要竞争对手是PyTorch。

▲ 图2.1.1 TensorFlow

RStudio提供了R与TensorFlow的API接口，RStudio官网及GitHub上也提供了TensorFlow扩展包的学习资料。

2.2 Keras

Keras是一个对小白用户非常友好且简单的深度学习框架。如果想快速入门深度学习， Keras将是不错的选择。

Keras是TensorFlow高级集成API，可以非常方便地和TensorFlow进行融合。Keras在高层可以调用TensorFlow、CNTK、Theano，还有更多优秀的库也在被陆续支持中。Keras的特点是能够快速搭建模型，是高效地进行科学研究的关键。

Keras的基本特性如下：

高度模块化，搭建网络非常简洁；
API简单，具有统一的风格；
易扩展，易于添加新模块，只需要仿照现有模块编写新的类或函数即可。

▲ 图2.2.1 Keras

RStudio提供了R与Keras的API接口，RStudio的官网及GitHub上也提供了Keras扩展包的学习资料。

2.3 Caffe

Caffe是由AI科学家贾扬清在加州大学伯克利分校读博期间主导开发的，是以C++/CUDA代码为主的早期深度学习框架之一，比TensorFlow、MXNet、PyTorch等都要早。Caffe需要进行编译安装，支持命令行、Python和Matlab接口，单机多卡、多机多卡等都可以很方便使用。

Caffe的基本特性如下。

以C++/CUDA/Python代码为主，速度快，性能高。
工厂设计模式，代码结构清晰，可读性和可拓展性强。
支持命令行、Python和Matlab接口，使用方便。
CPU和GPU之间切换方便，多GPU训练方便。
工具丰富，社区活跃。

▲ 图2.3.1 Caffe

同时，Caffe的缺点也比较明显，主要包括如下几点。

源代码修改门槛较高，需要实现正向/反向传播。
不支持自动求导。
不支持模型级并行，只支持数据级并行。
不适合非图像任务。

虽然Caffe已经提供了Matlab和Python接口，但目前不支持R语言。caffeR为Caffe提供了一系列封装功能，允许用户在R语言上运行Caffe，包括数据预处理和网络设置，以及监控和评估训练过程。该包还没有CRAN版本，感兴趣的读者可以在GitHub找到caffeR包的安装及使用的相关内容。