Ubuntu下跑通py-faster-rcnn详解demo运作流程

Posted zhengaloha

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Ubuntu下跑通py-faster-rcnn详解demo运作流程相关的知识,希望对你有一定的参考价值。

在不同的服务器不同的机器上做过很多次实验,分别遇到各种不一样的错误并且跑通Py-Faster-RCNN,因此,在这里做一个流程的汇总:

一、下载文件:

首先,文件的下载可以有两种途径:

1、需要在官网上下载路径:https://github.com/rbgirshick/py-faster-rcnn

该方法的下载之后文件夹:py-faster-rcnn/caffe-fast-rcnn/下可能是空白:这个时候你是需要继续用命令行进行下载的

 

cd caffe-fast-rcnn
git submodule update --init --recursive

 

 

2、在Ubuntu下直接进行命令行的下载:(个人更推荐这一方法:比较稳定)

  git clone --recursive https://github.com/rbgirshick/py-faster-rcnn.git

 

二、编译CAFFE:

1、下载完成后我们进入py-faster-rcnn//lib 文件下编译:

 

cd $FRCN_ROOT/lib
make

     2、在py-faster-rcnn/caffe-fast-rcnn/文件路径下,下载Makefile.config文件:

 

链接网址:https://dl.dropboxusercontent.com/s/6joa55k64xo2h68/Makefile.config?dl=0

3、改变里面两个参数:(不改变的话后面的编译可以进行,但是跑到后面的demo 的时候会发现一大堆的头文件没有包含进来,如下图)

技术分享图片

所以改变下面两个参数非常有必要:

 

# In your Makefile.config, make sure to have this line uncommented
WITH_PYTHON_LAYER := 1
# Unrelatedly, it‘s also recommended that you use CUDNN
USE_CUDNN := 1

4、编译caffe:

 

 

cd $FRCN_ROOT/caffe-fast-rcnn

 

 

make -j64

 

 

可能会出现错误,如下所示:

技术分享图片

 

解决办法:进入自己根目录下原来的Caffe下面拷贝相应的文件进入caffe-fast-rcnn

1.将./include/caffe/util/cudnn.hpp 换成最新版的caffe里的cudnn的实现,即相应的cudnn.hpp.

2. 将./include/caffe/layers里的,所有以cudnn开头的文件,例如cudnn_conv_layer.hpp。   都替换成最新版的caffe里的相应的同名文件。

3.将./src/caffe/layer里的,所有以cudnn开头的文件,例如cudnn_lrn_layer.cu,cudnn_pooling_layer.cpp,cudnn_sigmoid_layer.cu。

    都替换成最新版的caffe里的相应的同名文件。如下图所示:

技术分享图片

继续上面工作:

技术分享图片

编译成功!继续前面命令行的编译 :

 

 

make pycaffe

技术分享图片

 

编译正确:继续后面步骤;

三、下载训练好的模型:

1、命令行下载:

 

cd $FRCN_ROOT
./data/scripts/fetch_faster_rcnn_models.sh

2、从ImageNet训练来的Caffe models (ZF, VGG16) pre-trained 模型下载命令(在SCRIPTS文件下包含下载的脚本,如果遇到错误一定是服务器上FQ的问题)

 

 

./data/scripts/fetch_imagenet_models.sh

3、 从VOC 2007训练来的Faster R-CNN models trained 模型下载命令(同上)

 

 

./data/scripts/fetch_faster_rcnn_models.sh

 

4、设置好以上下载之后,我们的./data目录下会出现需要的模型:

技术分享图片

技术分享图片

四、跑通demo.py文件:

上面已经编译好了caffe并且下载做好了训练好的模型何必要数据:我们现在可以开始跑demo了:

 

cd $FRCN_ROOT
./tools/demo.py

跑通之后我们可以看到自己预测的图片的目标框:

 

技术分享图片

五、我们不局限于跑通demo.py,我们需要了解demo.py文件里面的原理:

首先我们来切割demo.py文件里面的功能块:无非是:def vis_detections( ) 、def demo( ) 、def parse_args() 

         先来看一张功能解析图:

技术分享图片

 

我们可以看到:demo.py文件的主流是黄色箭头、def vis_detections( ) 是紫色箭头、def demo( ) 是浅蓝色箭头、def parse_args() 是红棕色箭头。

随着箭头的延伸我们越来越深入了解里面的函数转换:其中:scores代表分数;boxes代表目标框对角两个点四个坐标值;dets代表各个框坐标和分数组成的矩阵、inds超过阈值符合要求的窗口对应的下标。

六、具体代码内容解释:

Po出一些详细的解释的手稿:

技术分享图片

技术分享图片技术分享图片技术分享图片

以上是关于Ubuntu下跑通py-faster-rcnn详解demo运作流程的主要内容,如果未能解决你的问题,请参考以下文章

py-faster-rcnn + opencv3.0.0 + ubuntu16.04配置

ubuntu14.04 + cuda8.0 + cudnnv5 + caffe + py-faster-rcnn配置

cuda8.0环境下安装py-faster-rcnn问题总结

基于Ubuntu 16.04,手持Kinect v2,实时跑通ORB_SLAM2

ubuntu从零到一跑通ORB_SLAM2及其ORBSLAM2_with_pointcloud稠密建图

py-faster-rcnn 的makefile.config 注意事项