基于遗传算法寻优的多核支持向量机故障诊断系统
Posted 安阳工学院学报
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了基于遗传算法寻优的多核支持向量机故障诊断系统相关的知识,希望对你有一定的参考价值。
摘要:针对传统的单核SVM 已经无法满足多个不同数据源的复杂问题,提出了支持向量机多核学习的改进方法。多核支持向量机的学习能力、泛化能力、决策能力在很大程度上取决于参数的选择以及多核权值系数的优化。对此,本文使用遗传算法对多核权值系数寻优,设计多核支持向量机故障诊断系统,此系统在某型飞机的垂直陀螺故障诊断中进行了验证,验证分别利用单核支持向量机和多核支持向量机分类精度对比,结果表明遗传算法寻优得到的权值系数使多核支持向量机分类精度明显提高。
关键词:故障诊断;遗传算法;多核支持向量机;参数优化
0 引言
支持向量机在提高分类的准确性和训练决策函数中,会出现一些重要参数,例如核函数的参数、惩罚因子等。这些参数的确定对支持向量机的学习性能和分类性能影响很大[1]。在训练求解支持向量机学习机器时,不合理的参数会使分类方法出错,分类精度过低,导致支持向量机理论与实际应用相脱离。所以,支持向量机从理论走向实际的关键就是支持向量机模型的选择问题,也就是核函数及其参数、惩罚因子的选择问题。
传统意义上的单核支持向量机在实际应用中,由于单核可选择的局限性,分类结果可解释性能不足,分类精度过低,很难应用于实际问题中。为此,本文采用多核学习方法(MKL)来弥补单核的不足,构造多核的思想是多个单核作为基核进行线性组合得到“混核”作为支持向量机的核函数。基核函数进行线性组合时,权重系统影响了各基核的比重,因此,要想得到学习能力强、推广能力广的支持向量机,需对各基核前的权值系数进行优化。目前有多种优化方法,如梯度下降法。梯度下降法在寻优过程中得不到全局最优解[2],容易限于局部极小点。为了避免出现得不到全局最优解的问题,本文权重系数的寻优采用遗传算法。在支持向量机学习中,遗传算法可以使权重系数是动态调整的,测试每次形成的多核SVM的分类精度,判断是否满足条件,直到输出的最优权值系数使支持向量机的分类精度最高。
1 多核支持向量机的构造
支持向量机的核函数决定了其泛化能力和推广能力。核函数的不同,高维特征空间中样本的分布就不同,支持向量机决策能力就不同,分类精度差别就会很大[3]。支持向量机用于实际应用领域中,样本数据是训练支持向量机的根本,所以适合样本数据的核函数选择是关键,这对支持向量机的分类精度与鲁棒性影响很大。因此,本文提出多核支持向量机改进单核函数的分类性能。多核的思想是将多个单核的线性组合构成SVM的核函数。即:
公式中:M 为单核的数目;dk 为第k 个单核的权值;Kk(xi,x) 为基本的核函数。单核支持向量机分类函数的形式
其中{xi,yi} 是样本数据,l是样本数据的个数,{α*i }i ,b* 是样本训练得到的相关参数。综合式(1)式(2)可得多核函数支持向量机的分类函数为:
基于多核学习支持向量机模型的可表示为:
式中,ξi 为松弛变量,C为惩罚参数,fk ∈Ηk ,其中Ηk 是基本单核的高维特征空间。
由Mercer 定理可知,多个单核线性组合后的核函数,依然为Mercer核,因此非线性支持向量机推导过程中的优化问题即转化为
利用Largrange乘数法和KKT条件,其对偶问题为:
求出公式(6)最优化问题,即得到最优分类函数
2 仿真验证
2.1 样本数据的采集
本文采用某型飞机在1 5000m平飞时的垂直陀螺的故障数据作为训练支持向量机的样本数据,经判断故障数据类型有完全故障、冲击故障、乘性故障、偏差故障[4]。此型号飞机的飞控计算机采集俯仰角信号的采样周期为25ms,本文设计的故障诊断系统,按设计要求需1s对传感器诊断一次,也就是采集1s的数据,将这组数据作为一个样本。因此可采集到正常状态、完全故障、偏差故障、乘性故障、冲击故障5种状态数据各为100组,其中80组作为训练样本数据,20组作为测试系统数据。
2.2 单核SVM 实验
实验中,利用上述采集俯仰角五种状态下的各100组数据作为样本数据对单核支持向量机进行训练与测试。为了便于比较证明不同核函数训练得到的SVM的性能的差别,本文使用了三种核函数分别为线性核、RBF核函数以及多项式核函数。多项式核函数的参数分别选择2、3;RBF核的参数C 和γ 是通过交叉验证法进行优化,参数优化后C =6.8 ,σ2 =0.022 。仿真所用时间为表1 所示。相应的分类结果分类精度如表2~5。
从表1中可以对比出4种单核构成的支持向量机的可解释性与仿真时间。线性核分类器精度很低,表明样本数据是线性不可分的,因此,必须通过核函数将样本数据映射到高维空间中使其线性可分。RBF核SVM、多项式核分类精度与仿真时间都比较理想。从表中还可以看出参数不同,分类精度也不同,表明核函数参数对样本的诊断精度影响很大,多项式核函数参数选择3时的分类精度更高。RBF核的分类精度为82%,分类精度最高;RBF核的参数采用了样本数据进行交叉验证法得到的最优参数,因此比多项式核的选取更贴近实际应用,表明RBF核对实际问题的学习能力很强。因此,RBF单核SVM和多项式核SVM学习性能、对实际问题的可解释性相对较强,可选作多核SVM中多核的组成成分.
2.3 基于遗传算法的多核SVM 实验
多核SVM实验中保持了单核实验中某型飞机15 000M平飞时垂直陀螺的故障实验,又添加了爬升、下滑两种方式下垂直陀螺发生冲击、偏差、完全、乘性故障时俯仰角数据。数据的采集周期仍为1s,同样采集100组样本数据,80组用于训练多核学习支持向量机,20 组用于测试系统。依据2.3.2 中选择出学习能力强的单核作为多核的基核。因此,本文选择RBF核函数和多项式核函数,进行线性组合实验,证明多核学习机的分类精度与可解释性均优于单核支持向量机。
2.3.1 遗传算法寻优核权系数的设计
1)串的编码
核函数的权值系数为[0,1]之间的任意实数,本文串的编码采用实数编码[5]。
2)确定适应度函数
适应度函数也称为寻优判断函数,在SVM训练目的是提高故障诊断的诊断精度,故本文将测试数据的诊断精度选作适应度函数,定义如下:
3)遗传算子
遗传算子包括选择,交叉和变异。当最初样本数据没有满足的适应度函数,遗传操作就要根据初始样本选择、变异,产生新的样本。所以,遗传算子是寻优的关键[6]。
①选择:设种群规模为Size,个体μi 的被选择为下一代个体的概率为
从式(9)中可以看出,适应度函数高,被复制的概率就大,优秀的特征就会被保存。
② 交叉:交叉的概率范围为[0.50, 1.0],随机从选择出的优秀个体群中的两个进行交叉。
③ 变异:变异可以得到特性多样性的种群;变异的操作方法为:选取第i 个体的第j 个基因,写为aij ,变异如下:
amax 为aij 的最大值,amin 为基因的最小值,f (g)=r2(1-g/Gmax)2 ,r2 是[0,1]任意随机数,最大进化次数是Gmax ,迭代次数为g 。
依据故障诊断系统参数优化的目的与遗传算法的寻优过程,本文基于遗传算法的多核学习SVM的算法流程图如图1所示:
图1 算法流程图
2.3.2 多核SVM 实验
本文对3种飞行方式下的样本数据做了多项式核和RBF核的不同组合实验。遗传算法寻优中种群规模设为Size=50,遗传终止迭代数选择为t=200。为了更好地证明多核的有效性,RBF单核、多项式核的惩罚因子C 、参数均与单核SVM实验相同。因此,得到3种组合方式的实验如表6所示并且每种组合进行了5次实验,其中运行时间是5次实验的平均值;分类精度为5次实验中最高分类精度权系数是最高分类精度的权系数。
表6给出了某型飞机1 5000m平飞、爬升、下滑3种飞行状态下不同基核组合的实验结果。实验表明:多核SVM的分类精度对明显提高,学习能力强,对样本数据的可解释性高于单核。实验证明,利用遗传算法来对多核支持向量机的核权值系数进行寻优是一个可行的方法,并且所得到的多核支持向量机比单核具有明显的优越性。
爬升(组合1)仿真试验的多核支持向量机分类精度优化曲线,即适应度函数曲线如图2所示。遗传选择到37 代左右适应度函数值基本保持稳定。图3表示了爬升(组合1)在遗传算法寻优迭代过程中迭代到第37代,权系数的取值已经比较稳定了。
图2 适应度函数变化曲线图
3 多核取值系数变化曲线
3 结论
多核支持向量机方法中,权值系数、参数的优化过程复杂,势必会使学习的过程难度增大。研究高效、快速的学习算法是解决故障诊断系统复杂性的有效方法。本文在遗传算法的基础上进行了编码、遗传算子和适应度函数的设计,对构造的多核权值系数进行了寻优,结构表明经过寻优的系数构造的多核支持向量机,其分类精度相比较单核支持向量机来说,有明显得提高。
参考文献:
[1] 卓严报.基于支持向量机的城市给水管网故障诊断研究[D].重庆:重庆大学,2013.
[2] 郭创新,朱承治,张琳,等.应用多分类多核学习支持向量机的变压器故障诊断方法[J].中国电机工程学报,2010(13):128-134.
[3] 孙学初,张浩. 无人机飞控系统故障诊断专家系统设计[J]. 自动化信息,2011 (12):53-54.
[4] 汪洪桥,孙富春,蔡艳宁,等. 多核学习法[J]. 自动化学报,2010,36(8):1037-1050.
[5] 李翠平,郑瑶瑕,张佳,等. 基于遗传算法优化的支持向
量机品位插值模型[J]. 北京科技大学学报,2013,35(007):837-843.
[6] 何委徽,王家林,胡龙胜. 实数编码多种群遗传算法的改
进及应用[J]. 地球物理学报,2009,52(10):2644-2651.
(责任编辑:王彦永)
作者简介:叶慧(1986-),女,江苏徐州人,硕士研究生,毕业于南京航空航天大学,主要研究方向为信号处理、故障智能诊断技术。
以上是关于基于遗传算法寻优的多核支持向量机故障诊断系统的主要内容,如果未能解决你的问题,请参考以下文章
轴承故障诊断基于matlab贝叶斯优化支持向量机轴承故障诊断(西储数据)含Matlab源码 2027期
轴承故障诊断基于matlab贝叶斯优化支持向量机轴承故障诊断(西储数据)含Matlab源码 2027期
优化分类基于matlab遗传算法优化支持向量机分类(多输入多分类)含Matlab源码 QF003期