用opencv3.3自带的traincascade.exe训练LBP特征的分类器

Posted 2020-10-12

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了用opencv3.3自带的traincascade.exe训练LBP特征的分类器相关的知识，希望对你有一定的参考价值。

opencv3.3中有可以训练分类器opencv_traincascade.exe，可以用HAAR、LBP和HOG特征训练分类器。

这个函数都可以在opencv\\build\\x64\\vc14\\bin文件夹下找到，本文主要讲opencv_traincascade.exe训练LBP特征的分类器。

训练的过程包过四步：

①样本的准备

②对样本进行处理

③生成样本描述文件

④训练分类器

1、样本的准备

　　以行人训练为例，首先正样本是各种各样的行人的照片，负样本就是非人照片。样本个数最好在上千个，个数太少训练出来的分类器不能准确的检测行人，网上对正负样本的个数比例不尽相同，有的说3:1有的说7:3,具体的还是要自己去实验，我用的正样本有13692 个负样本5007个。把正负样本分别放在不同的文件夹下如：negative，positive。

技术分享

ps：对正负样本的几点说明

　　正负样本都要转化成灰度图，而且对于正样本用haar特征训练是规格化成20*20或其他大小，最好不要太大，过多的haar特征会影响分类器的训练时间；对于LBP特征正样本要规格化为24*24大小，而对于HOG要规格化成64*64. 负样本对尺寸没有统一要求，在训练对应的分类器时，选择的负样本尺寸一定要大于等于正样本规定的尺寸。

　　 a）正样本就是人的图片就行了，尽量包含少的背景。

　　b）负样本有两点要求：

　　　　一、不能包含正样本且尽可能多的提供场景的背景图；

　　　　二、负样本尽可能的多，而且要多样化，和正样本有一定的差距但是差别也不要太大，否则容易在第一级就全部被分类器reject，训练时不能显示负样本的个数，从而导致卡死。

2、对样本进行处理

在正负样本中各写一个批处理文件，如下图：

　　PostiveData.bat内容如下:

@echo off
:: 如果要文件名带上路径，则需要在dir这一句的%%~nxi上作改动
::                  code by FBY && RMW
if exist PostiveData.txt del PostiveData.txt /q
::for /f "delims=" %%i in (‘dir *.jpg /b /a-d /s‘) do echo %%~nxi PostiveData.txt
for /f "delims=" %%i in (‘dir *.png *.jpg *.ppm /b /a-d /s‘) do (
        echo %%~dpi%%~nxi 1 0 0 20 20>>PostiveData.txt
        )
if not exist PostiveData.txt goto no_file
start PostiveData.txt
exit

:no_file
cls
echo       %cur_dir% 文件夹下没有单独的文件
pause

　　NegativeData.bat内容如下:

@echo off
:: 如果要文件名带上路径，则需要在dir这一句的%%~nxi上作改动
::                  code by FBY && RMW
if exist NegativeData.txt del NegativeData.txt /q
for /f "delims=" %%i in (‘dir *.png *.jpg *.ppm /b /a-d /s‘) do (
        echo %%~dpi%%~nxi>>NegativeData.txt
        )
if not exist NegativeData.txt goto no_file
start NegativeData.txt
exit

:no_file
cls
echo       %cur_dir% 文件夹下没有单独的文件
pause

最终生成的是PostiveData.txt和 NegativeData.txt文件。

①PostiveData.txt格式：

技术分享

其中，第一列为图像名，第二列为该图像中正样本的个数，最后的为正样本在图像中的位置以及需要抠出的正样本的尺寸

②NegativeData.txt中只包含一列即图像名。

技术分享

3、生成样本描述文件

对正负样本进行以上预处理之后，就可以创建正样本vec文件了。

首先把opencv自带的训练函数和正负样本的.txt文件一起放到同一个文件夹下。如：

技术分享

命令行进入opencv_createsamples.exe文件夹下，依次输入：opencv_createsamples.exe -info PostiveData.txt -vec pos.vec -bg NegativeData.txt -num 13692 -w 20 -h 20 回车之后文件夹下就会出现pos.vec文件。

技术分享

以上参数的含义如下：
－vec <vec_file_name>：训练好的正样本的输出文件名。
－img<image_file_name>：源目标图片（例如：一个公司图标）
－bg<background_file_name>：背景描述文件。
－num<number_of_samples>：要产生的正样本的数量，和正样本图片数目相同。
－bgcolor<background_color>：背景色（假定当前图片为灰度图）。背景色制定了透明色。对于压缩图片，颜色方差量由bgthresh参数来指定。则在bgcolor－bgthresh 和bgcolor＋bgthresh 中间的像素被认为是透明的。
－bgthresh<background_color_threshold>

－inv：如果指定，颜色会反色
－randinv：如果指定，颜色会任意反色
－maxidev<max_intensity_deviation>：背景色最大的偏离度。
－maxangel<max_x_rotation_angle>，
－maxangle<max_y_rotation_angle>，
－maxzangle<max_x_rotation_angle>：最大旋转角度，以弧度为单位。
－show：如果指定，每个样本会被显示出来，按下"esc"会关闭这一开关，即不显示样本图片，而创建过程
继续。这是个有用的debug 选项。
－w<sample_width>：输出样本的宽度（以像素为单位）
－h<sample_height>：输出样本的高度（以像素为单位）

注意：只需要对正样本进行以上操作，负样本不需要生成vec文件

4、训练分类器

在以上准备工作都做好的情况下，就可以进行训练分类器了。

在cmd命令行下输入：
D:\\opencv3.3\\build\\x64\\vc14\\bin>opencv_traincascade.exe -data xml -vec pos.vec -bg NegativeData.txt -numPos 13692 -numNeg 5007 -numStages 20 -featureType LBP -w 20 -h 20

（其中-data后面的xml是在D:\\opencv3.3\\build\\x64\\vc14\\bin下面的文件夹，新建一个空的文件夹就行）

按enter就可以进入训练阶段了。

技术分享

opencv_traincascade.exe的命令行参数解释如下：

-data <cascade_dir_name>：目录用于保存训练产生的分类器xml文件和中间文件（对于上面的LBP_classifier），如不存在训练程序会创建它；

-vec <vec_file_name>：由 opencv_createsamples 程序生成的包含正样本的vec文件名（对应上面的pos_24_24.vec）；

-bg <background_file_name>：背景描述文件，也就是包含负样本文件名的那个描述文件（对应上面的neg\\neg.txt）；

-numPos <number_of_positive_samples>：每级分类器训练时所用的正样本数目（默认值为2000）；
-numNeg <number_of_negative_samples>：每级分类器训练时所用的负样本数目，可以大于 -bg 指定的图片数目（默认值为1000）；

-numStages <number_of_stages>：训练的分类器的级数（默认值为20级）；

-precalcValBufSize <precalculated_vals_buffer_size_in_Mb>：缓存大小，用于存储预先计算的特征值(feature values)，单位为MB（默认值为256）；
-precalcIdxBufSize <precalculated_idxs_buffer_size_in_Mb>：缓存大小，用于存储预先计算的特征索引(feature indices)，单位为MB（默认值为256）；

内存越大，训练时间越短。
-baseFormatSave：这个参数仅在使用Haar特征时有效。如果指定这个参数，那么级联分类器将以老的格式存储（默认不指定该参数项，此时其值为false；一旦指定则其值默认为true）；

级联参数：CvCascadeParams类，定义于cascadeclassifier.h
-stageType <BOOST(default)>：级别（stage）参数。目前只支持将BOOST分类器作为级联的类型；
-featureType<{HAAR(default), LBP}>：特征的类型： HAAR - 类Haar特征； LBP - 局部纹理模式特征（默认Harr）；
-w <sampleWidth>：训练样本的宽（单位为像素，默认24）；
-h <sampleHeight>：训练样本的高（单位为像素，默认24）；
训练样本的尺寸必须跟训练样本创建（使用 opencv_createsamples 程序创建）时的尺寸保持一致。

Boosted分类器参数：CvCascadeBoostParams类，定义于boost.h
-bt <{DAB, RAB, LB, GAB(default)}>：Boosted分类器的类型（DAB - Discrete AdaBoost, RAB - Real AdaBoost, LB - LogitBoost, GAB - Gentle AdaBoost为默认）；
-minHitRate <min_hit_rate>：分类器的每一级希望得到的最小检测率（默认值为0.995），总的检测率大约为 min_hit_rate^number_of_stages；
-maxFalseAlarmRate <max_false_alarm_rate>：分类器的每一级希望得到的最大误检率（默认值为0.5），总的误检率大约为 max_false_alarm_rate^number_of_stages；
-weightTrimRate <weight_trim_rate>：Specifies whether trimming should be used and its weight，一个还不错的数值是0.95；
-maxDepth <max_depth_of_weak_tree>：弱分类器树最大的深度。一个还不错的数值是1，是二叉树（stumps）；
-maxWeakCount <max_weak_tree_count>：每一级中的弱分类器的最大数目（默认值为100）。The boosted classifier (stage) will have so many weak trees (<=maxWeakCount), as needed to achieve the given -maxFalseAlarmRate；

其中训练出来的某一级的结果如下：

技术分享

等到分类器训练到你自己设定的级数就完成了。最后得到的cascad.xml就是我们需要的结果。

以上是关于用opencv3.3自带的traincascade.exe训练LBP特征的分类器的主要内容，如果未能解决你的问题，请参考以下文章