基于最优二叉树支持向量机的蜜柚叶部病害识别方法

Posted 中国农业信息化研究

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了基于最优二叉树支持向量机的蜜柚叶部病害识别方法相关的知识,希望对你有一定的参考价值。

0  引 言 

蜜柚是中国重要的水果之一,在其整个种植过程中,常常发生多种病害,主要包括黄斑病、炭疽病、疮痂病、煤烟病等,长期危害着蜜柚的叶片、花、果等,危害柚子叶部时,造成蜜柚叶部局部或整体畸形、卷曲和溃烂,发病严重时引起大量叶片掉落,进而影响蜜柚果实的产量与品质[1]现阶段蜜柚的病害识别主要是通过人工观察的方法,但该方法存在准确率低、速度慢、体力消耗大等问题,影响了蜜柚病害防治的准确性和时效性[2]

随着图像处理技术的发展,大量研究依据病害图像的大小、形状、颜色、纹理等参数或几个参数的组合来进行植物病害图像识别与分类[2-7]Sena[8]运用计算机图像处理技术对黄瓜角斑病和斑疹病的研究发现,与其他参数相比,色调H偏度可以较为明显区分不同病变情况。Camargo[9]尝试利用颜色直方图矩阵对4种棉花病害进行了识别,获得了较好的识别效果。Pydipati[10]通过颜色矩阵,对柑桔黑霉病、疤痕和油脂病图像进行了分类识别。Kuoyi等通过提取病斑的颜色特征,应用BP神经网络成功识别君子兰的软腐病,褐斑病和黑腐病,平均识别率达到89.6%[11]Phadikar[12]提取病害的颜色,形状和受感染的部分的位置特征,并利用粗糙集的方法对特征进行选择,结合分类规则库建立了水稻病害识别模型,对水稻的叶褐斑病、稻瘟病、鞘腐病、白叶枯病具有良好的识别效果,平均识别率在90%以上。Rumpf[13]利用支持向量机对早期的感染甜菜生尾孢、单孢锈菌蚜或白粉蚜引起角斑病,甜菜锈病和白粉病等甜菜病害进行识别,但由于病害的类型和不同阶段病斑的变化,其分类识别准确度在65%~90%。张建华等[4]提取棉花颜色与纹理特征,结合粗糙集的方法对特征进行优选,建立基于神经网络的棉花病害识别模型,获得了较好的识别效果。温芝元等[15]提取病斑标记区域内的傅里叶变换幅度谱图,进行多重分形分析及二次拟合,将拟合抛物线段的高度、宽度和质心坐标作为病虫害特征值,并建立了BP神经网络椪柑病虫害识别模型,平均正确识别率达到92.67%

综上所述,大多病害识别研究主要针对图像的全局信息,忽略了对病害的多尺度多方向的局部特征提取,且在病害分类模型中对多类支持向量机的构建多采用“一对一”方法或“一对多”方法,而对基于最优二叉树支持向量机方法进行病害识别缺少系统研究。因此,本研究针对蜜柚叶部病害识别难的问题,从叶部病害图像的局部信息入手,在多个颜色分量情况下,利用Gabor小波变换的幅值图像具有细微差别表达能力,提取不同颜色分量的多尺度多方向病害局部特征信息,并通过基于最优二叉树支持向量机对蜜柚的4种病害进行识别,为蜜柚病害准确识别与防治提供技术支撑。

1  材料与方法

1.1试验材料

20143~6月从中国农业大学试验基地,收集遭受黄斑病、炭疽病、疮痂病、煤烟病危害的蜜柚叶片。并根据文献[16]和文献[17]的作物病虫害危害等级等于病斑面积与叶片面积的比值方法,确定了蜜柚病害等级标准,见表1所示。按照确定的蜜柚病害等级标准,选择危害等级为Ⅲ级、Ⅳ级、Ⅴ级和Ⅵ级的中晚期病害蜜柚叶片进行采集。为确保采集的黄斑病、炭疽病、疮痂病、煤烟病等4种蜜柚病害的准确性和叶片病害的唯一性,每张蜜柚病害叶片都经过植保专家判别,确认所采集的蜜柚病害准确无误。


将收集的蜜柚病害叶片通过构建的图像采集系统进行图像采集,图像采集系统由载物台(30cm×20cm×5cm)、光照箱(60cm×50cm×70cm)、光源(48W荧光灯)、CCD相机(索尼RX10型数码相机,1600万像素)和计算机(Lenovo品牌,处理器为Intel i5-3470,双核3.20GHz,内存2.0GB),如图1所示。

基于最优二叉树支持向量机的蜜柚叶部病害识别方法

通过图像采集系统共获取了360幅蜜柚病害叶片图像作为实验对象,其中包含了黄斑病、炭疽病、疮痂病、煤烟病等4类蜜柚病害,每类各90幅。将图像进行256像素×256像素大小的标准化处理,处理后的蜜柚病害类型如图2所示。

基于最优二叉树支持向量机的蜜柚叶部病害识别方法

1.2特征提取方法

二维Gabor小波变换具有较好的空间域和频率域分辨能力,是图像的多尺度多方向表示和分析的有力工具,经常被用作小波基函数对图像进行各种分析,能较好地反映了生物视觉神经元的感受视野等优点[18,19]。因此,本文利用Gabor小波提取图像的纹理特征。

1.2.1 Gabor小波

Gabor小波变换是用一组滤波器函数与给定信号的卷积来表示或逼近一个信号[20,21]。二维Gabor小波函数傅里叶变换如式(1)所示:

基于最优二叉树支持向量机的蜜柚叶部病害识别方法

其中,基于最优二叉树支持向量机的蜜柚叶部病害识别方法

图像I(x,y)上任一点(x,y)的小波变换为:

基于最优二叉树支持向量机的蜜柚叶部病害识别方法

改变mn即可得到不同频带不同方向上的多通道小波变换。其中,基于最优二叉树支持向量机的蜜柚叶部病害识别方法为蜜柚病害图像,基于最优二叉树支持向量机的蜜柚叶部病害识别方法为核函数,基于最优二叉树支持向量机的蜜柚叶部病害识别方法为在尺度为m,方向为n时与蜜柚病害图像卷积的结果即为Gabor小波滤波器系数[22]

基于最优二叉树支持向量机的蜜柚叶部病害识别方法

1.2.2 基于Gabor小波的纹理特征提取

Gabor滤波器系数矩阵基于最优二叉树支持向量机的蜜柚叶部病害识别方法中的每一个元素为一复数值,对每一元素取其能量子带得到矩阵基于最优二叉树支持向量机的蜜柚叶部病害识别方法,并对基于最优二叉树支持向量机的蜜柚叶部病害识别方法进行采样率为的下采样,得到矩阵基于最优二叉树支持向量机的蜜柚叶部病害识别方法。图3(a)为蜜柚病害图像,图3(b)5个尺度8个方向Gabor小波变换后的幅值图像。对蜜柚病害图像进行5Gabor小波分解,则5个尺度的8个方向(分别对应图 2b)中的8个方向)共40个幅值图像,取不同尺度下8个方向的幅值平均值作为病害的纹理特征,则可得到5个图像特征。

1.3 病害分类识别方法

1.3.1 支持向量机

支持向量机是一种基于结构风险最小化的分类器,通过解二次规划问题,寻找将数据分为两类的最佳超平[24-27]。常有的核函数基于最优二叉树支持向量机的蜜柚叶部病害识别方法分别有:Gauss径向基核函数基于最优二叉树支持向量机的蜜柚叶部病害识别方法Sigmoid核函数基于最优二叉树支持向量机的蜜柚叶部病害识别方法、多项式核函数基于最优二叉树支持向量机的蜜柚叶部病害识别方法

1.3.2 基于最优二叉树的多类支持向量机

支持向量机是针对二分类问题提出的,对于多分类问题,以二元分类为基础,通过一定的组合原则,构造多类分类器,实现多类可分[30]。目前常用的多分类支持向量机主要有:一对一方法和一对多方法。其中一对一方法在分类时存在不可分区域,一对多方法识别性能一般[31]。因此,针对这2种方法的不足,提出了基于最优二叉树的多类支持向量机。

基于最优二叉树支持向量机的蜜柚叶部病害识别方法

本文针对蜜柚的黄斑病、炭疽病、疮痂病、煤烟病等4种病害,用类1表示黄斑病、类2表示炭疽病、类3表示疮痂病、类4表示煤烟病,构建了二层最优二叉树,如图4所示,第一层有1个支持向量机分类器即SVM12V34主要对1类、2类病害与3类、4类病害先进行识别分类,第二层为2个分类器分别是SVM1V2SVM3V4SVM1V2是对1类与2类病害进行识别,SVM3V4是对3类、4类病害进行识别分类。其中,第一层先将最大阈值间隔的病害来构建决策树的根结点,如黄斑病(类1)与煤烟病(类4),然后用同样的方法建立第二层,直到所有分类器构建完成,以使每个结点下的分支间隔最大,能有效降低分类识别的错误,避免误差向下累积的问题,从而得到分类识别正确率高的最优二叉树。二层最优二叉树支持向量机识别病害时具体算法流程如下:

Step1:提取4种病害样本的特征向量,首先从第一层根节点开始,计算分类器SVM1,2V3,4,根据输出值判断下一层结点的走向,如果该病害为类1或类2,则转向下一层左边叶子节点SVM1V2,如果该病害不为类3或类4,则转向下一层右边叶子节点SVM3V4

Step2:如果为左边叶子节点,则计算分类器SVM1V2,如果该病害计算结果为正则为类1,如果该病害计算结果为负则为类2

Step3:如果为右边叶子节点,则计算分类器SVM3V4,如果该病害计算结果为正则为类3,如果该病害计算结果为负则为类4

2 结果与分析

对蜜柚病害识别进行仿真试验,试验平台为Lenovo计算机,处理器为Intel i5-3470,双核3.20GHz,内存2.0GB,操作系统为Windows7.0,仿真软件为Matlab2011a。蜜柚病害识别试验分2部分进行,第1部分为特征提取与分析试验,提取出最优的特征向量;第2部分为基于最优二叉树的支持向量机识别试验,获得最优的病害识别方法。

2.1 特征提取与分析试验

由已有病害图像特征提取研究可知,不同类别病害之间在颜色和纹理方面存在较大差异[32-33]。分别从RGB颜色模型(即红-绿-蓝颜色模型)、超绿红蓝颜色模型、HSI颜色模型(即色调-饱和度-亮度颜色模型)、YIQ颜色模型(即亮度-橙青色差-紫黄色差颜色模型),选择R分量、G分量、B分量、Y分量、2G-R-B分量、2R-G-B分量、2B-G-R分量、G-B分量、R-B分量、(G+R+B)/3分量、H分量、S分量、Q分量等13个颜色分量,对采集的黄斑病、炭疽病、疮痂病、煤烟病等4种病害图像360幅图像进行统计分析,蜜柚叶部病害颜色特征分量统计结果如图5所示。从图5可以看出,在B分量统计上,黄斑病、炭疽病与疮痂病、以及与煤烟病之间具有一定差异性;在2G-R-B分量统计上,黄斑病、炭疽病、疮痂病、煤烟病的平均灰度值分别为:177、146、100、46,在4种病害之间具有较大可区分性;在(G+R+B)/3分量统计上,黄斑病、炭疽病、疮痂病、煤烟病的平均灰度值分别为:125、108、156、124,除了黄斑病与煤烟病之间差异性较小外,其他病害之间有相差较大;在Q分量统计上,黄斑病、炭疽病、疮痂病、煤烟病的平均灰度值分别为:70、75、42、96,除黄斑病与炭疽病相差不大外,其他病害之间具有可区分性。因此,经蜜柚叶部病害颜色特征分量统计发现:B分量、2G-R-B分量、(G+R+B)/3分量以及YIQ颜色模型中的Q分量对蜜柚叶片病害区分性较其他颜色分量大。

基于最优二叉树支持向量机的蜜柚叶部病害识别方法

Fig. 5 Pomelo leaf disease color characteristic component statistics

    对采集的黄斑病、炭疽病、疮痂病、煤烟病等4种病害图像360幅图像进行纹理特征统计分析。提取病害图像的B分量、2G-R-B分量、(G+R+B)/3分量以及Q分量的灰度图像,并用5个尺度、8个方向的Gabor 小波滤波器对灰度图像进行卷积变换,获取40Gabor小波幅值,对不同尺度情况下的8个方向幅值取平均值,再除以255以使得幅值归一化至0~1之间。4种病害Gabor小波5个尺度幅值统计结果图如图6所示。从图中可以看出,B分量的尺度24种病害幅值平均值区分最为明显,4种病害在2G-R-B分量的尺度1、尺度2和尺度3的幅值平均值差异最大,(G+R+B)/3分量在尺度1至尺度4的区分度较高, Q分量的前2个尺度最为容易区分。因此,将二维Gabor小波对B分量的尺度22G-R-B分量尺度1、尺度2、尺度3(G+R+B)/3分量的尺度1至尺度4Q分量的尺度1、尺度28个方向平均幅值作为纹理特征进行提取。

基于最优二叉树支持向量机的蜜柚叶部病害识别方法

2.2 基于最优二叉树的支持向量机识别试验

    试验中,从每类90幅蜜柚病害图像中,随机选取60幅图像,共240幅病害图像作为训练样本,4类病害剩余30幅图像,共120幅作为测试样本。在Windows7.0操作系统和Matlab2011b软件平台上进行试验。通过Matlab库文件自带的SVM分类器,构建出基于最优二叉树的支持向量机病害多类识别模型,对黄斑病、炭疽病、疮痂病、煤烟病等4类蜜柚病害进行分类识别测试。构成的三层决策分类树,每个分类器内积核函数都采用径向基核函数基于最优二叉树支持向量机的蜜柚叶部病害识别方法,核函数的宽度基于最优二叉树支持向量机的蜜柚叶部病害识别方法和误差惩罚参数C通过对每个结点处样本集的交叉验证来调节,得出最优的参数。由于试验所用蜜柚样本数据量较小,因此采用交叉验证的方法进行分类识别测试。蜜柚病害识别训练识别流程如图7所示,从图中可知,首先提取蜜柚病害的B分量、2G-R-B分量、(G+R+B)/3分量、Q分量图像,再利用Gabor小波对提取的4个分量图像进行4个尺度情况下的8个方向平均幅值,最后将4个分量图像获得的4个尺度幅值组合在一起,共16维作为试验的特征变量。

基于最优二叉树支持向量机的蜜柚叶部病害识别方法

根据蜜柚叶部病害分类识别测试结果(见表2),在二层最优二叉树支持向量机病害识别中,第一层根结点分类器SVM1,2V3,4在识别黄斑病、炭疽病(12)和疮痂病、煤烟病(34)时,每类病害图像30幅,黄斑病中的2幅图像、炭疽病中的1幅图像和1幅疮痂病图像识别错误,而烟煤病错误识别数为0,准确率分别为93.33%96.66%96.66%100%。根据原因分析是因为有1幅黄斑病为病害初期,叶片只有少量病斑,提取的纹理特征与疮痂病相似,从而执行了错误分类,另一幅黄斑病颜色与烟煤病相同,识别错误;这1幅炭疽病叶片识别错误是因为叶片没有发生卷曲,与训练中的炭疽病叶片会发生不同程度卷曲现象提取的纹理特征信息存在差异;1幅疮痂病识别错误是因为出现该病害同时叶片由于脱水发生了自然卷曲,被误判为炭疽病。

第二层叶结点分类器SVM1V2在识别黄斑病与炭疽病时,炭疽病全部识别正确,而黄斑病中的1幅图像因为叶片发生卷曲而被错误识别为炭疽病,但因第一层分类器的累计的错误,因此,黄斑病与炭疽病准确率分别为90.00%96.66%。叶结点分类器SVM3V4在识别疮痂病与煤烟病中,分别出现了1幅图像的错误识别,因为都为疮痂病发生的同时出现了煤烟病,因此,疮痂病与煤烟病准确率分别为93.33%96.66%

由第二层2个叶结点分类器识别的准确率即为单项病害识别的准确率,黄斑病、炭疽病、疮痂病与煤烟病,4种病害单项病害识别准确率分别为90.00%96.66%93.33%96.66%4种病害平均识别准确率达到94.16%。因此,表明基于最优二叉树的支持向量机模型可较好的对4种蜜柚叶部病害进行识别。

2.3 蜜柚叶部病害识别比较试验

为了进一步验证本文方法的可行性,将本文方法与BP神经网络、一对一SVM与一对多SVM进行比较。其中BP神经网络采用160-80-4三层结构,学习速率为0.5、惯性系数设定为0.8、目标误差为0.01,迭代次数设定为800;一对一SVM和一对多SVM都采用径向基核函数,其中一对一SVM共有分类器数为4个,一对多SVM共有分类器数目4个。试验中,训练集与测试集情况与“基于最优二叉树的支持向量机识别试验”相同,即训练集为240幅病害图像,测试集为120幅病害图像,在不同特征变量情况下,分别从训练时间和识别精度2个方面,对蜜柚病害识别进行对比分析。特征变量分为B分量特征、2G-R-B分量特征、(G+R+B)/3分量特征、Q分量特征、综合特征等5个类型。其中,B分量特征为B颜色分量下提取的4个尺度Gabor 小波不同方向的平均幅值,共4个特征变量;2G-R-B分量特征为2G-R-B分量下的4个尺度Gabor 小波不同方向的平均幅值;(G+R+B)/3分量特征为2G-R-B分量下的4个尺度Gabor 小波不同方向的平均幅值;Q分量特征为Q分量下的4个尺度Gabor 小波不同方向的平均幅值;综合特征即为“B分量特征”+“2G-R-B分量特征”+“(G+R+B)/3分量特征”+“Q分量特征”,共16个特征变量。

4种识别方法不同特征变量训练时间结果见表3,从表中可以看出,在不同特征变量方面,由于综合特征的维数是16维多于其他分量特征的4维,训练时间较B分量特征、2G-R-B分量特征、(G+R+B)/3分量特征、Q分量特征训练时间长。在不同训练方法方面,BP神经网络方法在单项分量特征情况为平均训练时间为600ms,综合特征训练时间为740ms,耗时远远多于支持向量机方法;一对一SVM、一对多SVM和本文方法的单分量特征训练时间分别为350ms、370ms、300ms,在综合特征训练时间,一对一SVM、一对多SVM和本文方法分别为420ms、450ms、370ms,本文方法较一对一SVM和一对多SVM的训练时间少。因此,从训练时间角度看,本文方法较BP神经网络、一对一SVM和一对多SVM的训练时间短。是因为本文方法从支持向量机分类器结构上采用了最优二叉树的方法,减少了需要训练的分类器个数,从而缩短了训练的时间。

    在不同特征变量情况下,4种方法识别病害结果见表3,从中可以看出,随着特征变量的变化,4种方法的识别准确率都不同程度的影响,综合特征的识别率明显高于单分量特征,在单分量特征中,2G-R-B分量特征和(G+R+B)/3分量特征识别率要好于B分量和Q分量。从不同识别方法上看, BP神经网络、一对一SVM、一对多SVM和本文方法在综合特征的识别率分别为:86.00%91.50%90.00%94.16%。因此,从病害识别结果可以得出,本文方法较BP神经网络、一对一SVM和一对多SVM的识别效果优越。

3. 结论

1)利用5尺度8方向的Gabor小波与B分量、2G-R-B分量、(G+R+B)/3分量以及YIQ颜色模型中的Q分量的灰度图像进行卷积计算,获取了16个特征向量,所提取的特征具有多尺度多方向的特性,同时又充分反映了不同病害之间细微的差别,使得提取的特征具有较高区分性。

2)构建的基于最优二叉树支持向量机蜜柚叶部病害识别模型,经过最优二叉树,3个SVM分类器的计算,最终确定病害的种类;通过交叉验证的方法进行分类识别测试,得出:黄斑病、炭疽病、疮痂病、煤烟病识别准确率分别为90%、96.66%、93.33%、96.66%,平均识别率达到94.16%,表明本文方法可有效识别蜜柚叶部的4种病害。同时,该研究构建的蜜柚叶部病害识别模型试验结果是针对中晚期病害得出的结果,而对于早期病害的检测与识别在今后还需进一步测试。

3)通过将本文方法与BP神经网络、一对一SVM与一对多SVM进行比较,试验结果得出:在综合特征训练时间上,BP神经网络、一对一SVM、一对多SVM和本文方法分别为740ms420ms450ms370ms;在病害识别精度上,BP神经网络、一对一SVM、一对多SVM和本文方法在综合特征的识别率分别为:86.00%91.50%90.00%94.16%。因此,本文方法在训练时间和蜜柚病害识别精度上都优于其他3种方法。但本文方法只针对叶片感染单一病害的识别,而对于同一叶片感染多种病害,以及病害与虫害同时危害的情况,需要进一步研究与探索。


(发表期刊:农业工程学报,2014,30(19):222~231)

以上是关于基于最优二叉树支持向量机的蜜柚叶部病害识别方法的主要内容,如果未能解决你的问题,请参考以下文章

最优二叉树

成果作物生长发育模拟图像识别技术及应用

李就好:作物叶部病害图像识别研究

最优二叉树求权值

一本正经的聊数据结构:最优二叉树 —— 哈夫曼树

一本正经的聊数据结构:最优二叉树 —— 哈夫曼树