开源!让图像识别训练速度提升了8.7倍

Posted 计算机视觉联盟

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了开源!让图像识别训练速度提升了8.7倍相关的知识,希望对你有一定的参考价值。

点上方蓝字计算机视觉联盟获取更多干货

在右上方 ··· 设为星标 ,与你不见不散


仅作学术分享,不代表本公众号立场,侵权联系删除
转载于:量子位
AI博士笔记系列推荐

大规模图像识别任务上,DeepMind的新方法火了。

不仅拿到了SOTA,训练速度还提升了8.7倍之多!

方法关键:去“批处理归一化”

对于大多数图像识别模型来说,批处理归一化(batch normalization)是非常重要的组成部分。

但与此同时,这样的方式也存在一定的局限性,那就是它存在许多并不重要的特征。

虽然近期的一些研究在没有归一化的情况下,成功训练了深度ResNet,但这些模型与最佳批处理归一化网络的测试精度不相匹配。

而这便是DeepMind此次研究所要解决的问题——提出了一种自适应梯度剪裁 (AGC) 技术。

具体而言,这是一种叫做Normalizer-Free ResNet (NFNet)的新网络。

开源!让图像识别训练速度提升了8.7倍

整体来看,NFNet的整体结构如上图所示。

以有无“transition块”来划分,可以再细分为2种情况。

开源!让图像识别训练速度提升了8.7倍

其中,它们的bottleneck ratio均设置为0.5,且在3 x 3的卷积中,无论信道的数量为多少,组宽都固定为128。

二者的区别在于skip path接收信号的方式,左侧的是在用β进行variance downscaling和缩放非线性之后;而右侧则是在用β进行variance downscaling之前完成。

实验结果

在实验部分,DeepMind的研究人员,采用了与NFNet相关的7个模型做了对比实验,分别是NFNet-F0至NFNet-F6。

不难看出,在各个模型的对比过程中,在Top-1精度方面均取得了最好结果。

值得一提的是,与EfficientNet-B7相比,训练速度方面提升了8.7倍之多。

开源!让图像识别训练速度提升了8.7倍

此外,在对3亿张标记图像进行大规模预训练后,在ImageNet上还取得了89.2%的Top-1精度。

开源!让图像识别训练速度提升了8.7倍

最后,对于这项研究的代码,也已在GitHub上开源。

传送门

end


我是王博Kings,一名985AI博士,在Github上开源了机器学习、深度学习等一系列手推笔记,获得了不少同学的支持。
这是我的私人微信,还有少量坑位,可与相关学者研究人员交流学习 
目前开设有人工智能、机器学习、计算机视觉、自动驾驶(含SLAM)、Python、求职面经、综合交流群扫描添加CV联盟微信拉你进群,备注:CV联盟
开源!让图像识别训练速度提升了8.7倍
王博Kings 的公众号,欢迎关注,干货多多
开源!让图像识别训练速度提升了8.7倍
王博Kings的系列手推笔记(附高清PDF下载):









点个在看支持一下吧

以上是关于开源!让图像识别训练速度提升了8.7倍的主要内容,如果未能解决你的问题,请参考以下文章

图像识别太难?试试NVIDIA的交互式开源GPU训练平台DIGITS

谷歌 AI 新方法:可提升 10 倍图像识别效率,关键还简单易用

用深度学习理解遥感图像,识别效率提升90倍 | 百度PaddlePaddle&中科院遥感地球所

华软资本黄宇星丨AI篇:图像识别技术让生活更加智能

一套基于java的开源车牌识别算法

阿里「杀手锏」级语音识别模型来了!推理效率较传统模型提升10倍,已开源...