混合精度训练

Posted yangwenhuan

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了混合精度训练相关的知识,希望对你有一定的参考价值。

论文:https://arxiv.org/pdf/1710.03740.pdf

译文:混合精度训练

摘要

增加神经网络的size,可以提高准确率。但同时,也加大了训练模型所需的内存和计算量。我们介绍一种使用半精度浮点数来训练深度神经网络的方法,不会损失准确率,也不需要修改超参数

介绍

深度学习让很多不同的应用都取得了很大的进步,图像识别、语言建模、机器翻译和语音识别等等。这也衍生出两个关键的问题,更大的数据集和更复杂的模型

更大的模型通常需要更多的计算量和内存来训练。

以上是关于混合精度训练的主要内容,如果未能解决你的问题,请参考以下文章

Pytorch AMP——自动混合精度训练

基于OpenSeq2Seq的NLP与语音识别混合精度训练

ResNet实战:单机多卡DDP方式混合精度训练

CNN图像分类的小技巧(6): 提升训练效率-混合精度训练

混合,带有多个标签的精度

NLP涉及技术原理和应用简单讲解:paddle(分布式训练AMP自动混合精度训练模型量化模型性能分析)