基于前馈神经网络和支持向量机分类器的叶片识别

Posted 城市生物多样性和生态系统服务

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了基于前馈神经网络和支持向量机分类器的叶片识别相关的知识,希望对你有一定的参考价值。

图1  叶片结构及各部位名称


叶片识别在植物分类中是非常重要的,其重点是能够依据叶片来准确识别及区分不同的物种。与细胞和分子生物学等其他方法相比,基于叶片形状进行植物物种分类的优点很多,用户或研究者可以轻松地将叶子图像传输到计算机,然后计算机运用图像处理技术自动提取识别特征,完成识别任务。然而因为模型的不合适和代表性差,计算机辅助叶片识别在计算机视觉中仍然是非常具有挑战性的任务,评价提取叶片的形态特征成为至关重要的步骤之一。同时在训练样本的过程中,分类器的选择也很大程度上影响着叶片识别的精度,目前已有的分类方法很多,例如k-近邻分类器(k-NN),神经网络(NN),遗传算法(GA),支持向量机(SVM)和主成分分析(PCA)等。


Abbas H. Hassin AlAsadi 等人于2017年在International Journal of Computer Science and Mobile Computing上提交发表了一篇基于前馈神经网络支持向量机分类器实现叶片识别的文章。


基于前馈神经网络和支持向量机分类器的叶片识别

图2  叶片识别流程图


文章提出的方法涉及的主要步骤有图像预处理、边缘检测、特征提取分类。图像预处理步骤由四个子步骤组成:颜色转换,阈值处理,二值化操作和滤波过滤;边缘检测用于确定叶片位置;而特征提取取决于两种类型的特征:形状和纹理; 最后,使用两个的分类器: 前馈神经网络和支持向量机进行分类识别,实验结果应用于两个不同的数据集,获得了高达91%的准确度。


数据集的建立

基于前馈神经网络和支持向量机分类器的叶片识别

图3  数据集图片示例


在本文中,通过两种途径收集叶片图像:(1)人工手动拍摄图片,分别拍取10个树种中每个树种的10张照片;(2)leaf-snap叶片数据集,其中包含来自美国东北部的188种树种。数据集图片示例见图3。


图片预处理

基于前馈神经网络和支持向量机分类器的叶片识别

图4  图片预处理子步骤示意图


根据捕获装置,叶子图像难以直接被用于下一步的识别,因此,有必要改进和增强图像,使得叶片特征提取更容易,更可靠。本研究中,预处理步骤分为五个子步骤:1)RGB到HSV转换;2)阈值处理;3)边缘检测;4)滤波过滤;5)二进制转换。


叶片特征提取

有效的叶片识别系统需要提取一系列的叶片特征。准确且恰当地定义叶片形状,分析叶子之间最大的差异,是提高识别精度的关键。Abbas H. Hassin AlAsadi 等人在本研究中采用了叶片的形状和纹理特征。其中形状特征中分为:10个几何形态特征,7个数字形态特征和7个不变矩特征;纹理特征的提取使用统计工具灰度共生矩阵(GLCM)直接从图像中算出5个纹理特征,称为特征向量。

10个几何形态特征分别为:叶直径、叶长、叶面积、叶片周长、平滑因子、圆度、方度、直径与长度之比、周长与直径之比、周长与长度之比。7个数字形态特征为:平滑因子、长宽比、形状因子、方度、狭义因子、直径与周长之比、周长与生理长度和生理宽度之和比。

5个纹理特征分别为:角度二次矩(ASM)、角二阶矩、对比度、逆差矩(IDM)、熵、相关性。


基于前馈神经网络和支持向量机分类器的叶片识别

图5  纹理特征的定义公式


分类

使用两种分类方法对数据集进行分类如下:

1)前馈神经网络:前馈神经网络(Newff)是一种神经网络架构,其中连接“前馈”,即不形成周期。当在输入层输入某些东西并从输入到隐藏,从隐藏到输出层时,会使用“前馈”一词。

2)支持向量机:支持向量机(SVM)是一种基础的用于分类的机器,它由相关的监督学习技术组成。为了增加两个数据集之间的边界,SVM生成两个平行的超平面。


识别精度

基于前馈神经网络和支持向量机分类器的叶片识别

在第一行中,应用19个特征进行识别,SVM的识别准确率可达97.75%。与前人的研究相比,准确率显著提高(见表1)。


Supervisors

Accuracy (%)

Wu,stephen Gang, et al.

90.31

Singh et al.

81.50

Proposed System

97.57


表1   文中识别系统与相关研究的识别准确率对比



基于前馈神经网络和支持向量机分类器的叶片识别

编者认为:

基于前馈神经网络和支持向量机分类器的叶片识别

Abbas H. Hassin AlAsadi 等人的研究,考虑了叶片的形状特征以及纹理特征,综合提取利用叶片的多种信息,基于前馈神经网络和支持向量机分类器实现叶片识别,实验结果显示提出的叶片识别系统识别准确率为97.57%。从对比与前人的研究可以看出,Abbas H. Hassin AlAsadi等人提出的叶片识别系统识别率优于现有的其他叶片识别系统。方法的改进进一步提高了系统的识别性能。

编者认为,Abbas H. Hassin AlAsadi等人研究的创新性在于,他们选择了多种识别特征来描述叶片形状及特性,并对这些特征进行组合,分别实践各自的识别准确率,从而选出几种组合的最优,提高识别准确率。我们可以看到,并非使用的识别特征越多识别准确率就越高,这是因为选用的特征越多的情况下,要想使得某一图片满足所有特征参数要求,相对应的完全匹配可能性也许会降低,从而出现了像组合3和组合5这样的特例。

此外,无论对哪种识别特征组合而言,识别结果SVM都高于Newff。编者认为,这是因为训练样本不够大造成的。Newff是个“黑匣子”,优化目标是基于经验风险最小化,易陷入局部最优,训练结果不太稳定,所以往往需要更大的样本;而SVM又严格的的数学理论依据,泛化能力优于Newff,所以对于该研究中心1000多个的小样本训练而言,精度会更高。


原文出处


AlAsadi A H H, Anduljalil E Q, Khaleel A H. Leaf Recognition based on Neural Network Feed-Forward and Support Vector Machine Classifiers[J]. 2017.



UBES_China 提供城市生态系统服务和生物多样性研究和管理的最新信息。欢迎大家分享相关信息。投稿邮箱:ubes_china@126.com


以上是关于基于前馈神经网络和支持向量机分类器的叶片识别的主要内容,如果未能解决你的问题,请参考以下文章

基于最优二叉树支持向量机的蜜柚叶部病害识别方法

关于机器学习中支持向量机相关问题

关于机器学习中支持向量机相关问题

干货 | 使用支持向量机进行光学字符识别

什么是支持向量机?

支持向量机原理讲解(一)