深度学习端上部署工具

Posted pan_jinquan

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了深度学习端上部署工具相关的知识,希望对你有一定的参考价值。

深度学习端上部署工具

模型公司通用性别说明
tf-litetensorflow,开源

通用性最强,与 tensorflow 适配完美,不过性能一般

支持CPU和GPU

roadmap 中预计年底将实现对全系列rnn以及control flow的支持,值得期待!
TensorRTnvidia,闭源支持CPU和GPU仅支持nvidia gpu系列产品推理,平台的限定使得无法推广到一般的移动端设备使用
OpenCV
mnn阿里巴巴,开源踩在巨人的肩膀上进行研发,起点高,端上性能强悍,据说性能强于ncnn

吸取了最近两年开源的移动端推理框架的各种优秀成果

  • 针对conv3x3s1优化的winograd;
  • 针对网络图的优化以及层间数据复用;
  • 为提高访存效率,加入nchw4策略;
  • 支持int8低比特网络模型压缩及加速;

硬件支持:

  • cpu:为追求速度的极限,使用纯汇编实现了arm32、arm64两种版本的kernel;
  • gpu:支持metal、opencl、opengl、vulkan,全覆盖目前主流移动终端版本gpu,特别是对次时代框架vulkan的支持
TNN腾讯,开源支持CPU和GPU
ncnn腾讯,开源

大量手写汇编级别优化,移动端性能强悍

支持CPU和GPU

bolt华为,开源支持CPU和GPU官方数据中给出了端设备上bert的推理性能数据
mace小米,开源
paddle-lite百度,开源
pytorch-mobilefacebook,开源
caffe2facebook,开源
tvm陈天奇团队,开源

以上是关于深度学习端上部署工具的主要内容,如果未能解决你的问题,请参考以下文章

深度学习端上部署工具

将深度学习模型部署为exe需要哪些工具

开源深度学习模型部署工具箱MMDeploy简介及安装

开源深度学习模型部署工具箱MMDeploy简介及安装

学界 | 香港浸会大学:四大分布式深度学习框架在GPU上的性能评测

教程 | 如何使用KerasRedisFlask和Apache把深度学习模型部署到生产环境?