基于偏最小二乘及最小二乘支持向量机的人工加糙渠道糙率预测模型研究(葛赛,赵涛等)

Posted 南水北调与水利科技

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了基于偏最小二乘及最小二乘支持向量机的人工加糙渠道糙率预测模型研究(葛赛,赵涛等)相关的知识,希望对你有一定的参考价值。


基于偏最小二乘及最小二乘支持向量机的人工加糙渠道糙率预测模型研究(葛赛,赵涛等)
基于偏最小二乘及最小二乘支持向量机的人工加糙渠道糙率预测模型研究(葛赛,赵涛等)


基于偏最小二乘及最小二乘支持向量机的人工加糙渠道糙率预测模型研究


葛赛 1,赵涛 1,吴思 2,吴洋锋 1
( 1.新疆农业大学 水利与土木工程学院,乌鲁木齐 830052; 2.黄河勘测规划设计有限公司,郑州 450003)


作者简介

葛赛(1993-),女,河北廊坊人,主要从事水工水力学及内陆河流水沙运动反面研究。 

赵涛( 1976-),男,河南安阳人,满族,副教授,主要从事水力学及河流动力学方面研究。


基于偏最小二乘及最小二乘支持向量机的人工加糙渠道糙率预测模型研究(葛赛,赵涛等)
基于偏最小二乘及最小二乘支持向量机的人工加糙渠道糙率预测模型研究(葛赛,赵涛等)
基于偏最小二乘及最小二乘支持向量机的人工加糙渠道糙率预测模型研究(葛赛,赵涛等)
基于偏最小二乘及最小二乘支持向量机的人工加糙渠道糙率预测模型研究(葛赛,赵涛等)

摘要


影响渠道糙率的因素相当复杂,且因素间又存在一定的相关关系。为取得更为精确的糙率预测效果,采用偏最小二乘( PLS)法对影响人工加糙渠道糙率的因素进行分析,提取影响自变量的重要成分,结合最小二乘支持向量机( LSSVM)建立了人工加糙渠道糙率预测模型。结合实例,通过对某人工加糙渠道相关试验数据进行 PLS-LSSVM 模型的训练及预测,并将预测结果与单独使用 PLS、 LSSVM 及公式法的预测结果进行对比,其结果显示:基于 PLS-LSSVM 模型的预测平均绝对百分比误差 MAPE 为 1.38%,均方根误差 RMSE 为 2.24*10^-4 ,预测精度均优于 PLS、 LSSVM 及公式法的预测结果。结果表明,将 PLS 与LSSVM 相结合的 PLS-LSSVM 模型,综合了 PLS 与 LSSVM 各自的优势,应用 PLS-LSSVM 模型可有效进行人工加糙渠道糙率的预测。

关键词

偏最小二乘( PLS);最小二乘支持向量机( LSSVM);人工加糙渠道;糙率;预测

Study of artificial rough channel roughness prediction model based on partial least square and least square support vector machine

GE Sai1, ZHAO Tao1, WU Si2, WU Yangfeng1
(1.College of Water Conservancy and Civil Engineering, Xinjiang Agricultural University, Urumqi 830052,China; 2.Yellow River Engineering Consulting Co., Ltd, Zhengzhou 450003, China)

The factors that affect the roughness of channel are quite complex, and there is a certain correlation between factors. In order to obtain a more accurate prediction of the roughness, the partial least squares (PLS) method was used to analyze the factors that affect the roughness of artificial rough channel, and the important components that affect the independent variable were extracted, then the roughness prediction model of artificial rough channel was established based on least square support vector machine (LSSVM). Combining with the example, through the training and prediction of PLS-LSSVM model test data related to artificial rough channel, and the prediction results are compared with the prediction results of PLS, LSSVM and formula alone, the results show that the average absolute percentage error (MAPE) of prediction based on PLS-LSSVM model is 1.38%, and the root mean square error (RMSE) is 2.24*10^-4 , the prediction accuracy is better than that of PLS, LSSVM and formula method. The results show that the PLS-LSSVM model which combines PLS and LSSVM combines the advantages of PLS and LSSVM, PLS-LSSVM model can effectively predict the roughness of artificial rough channel.

Key words

partial least squares (PLS); least square support vector machine (LSSVM); artificial rough channel; roughness; prediction

基金项目

新疆维吾尔自治区自然科学基金项目(2015211A025)


基于偏最小二乘及最小二乘支持向量机的人工加糙渠道糙率预测模型研究(葛赛,赵涛等)


糙率[1]与河流阻力有关,是衡量渠道边壁粗糙程度对运动水流产生影响的一个无量纲数,其值重要且敏感,糙率的精确取值是明渠水流的水力计算向精准方向发展拟解决的关键问题之一。明渠糙率研究可分为两个方向,即天然渠道糙率和人工渠道糙率。人工渠道以其较为规则的结构形式及沿程均匀的粗糙程度,简化天然渠道复杂多变的水力要素,同时加糙处理后的人工渠道增加了多种边壁粗糙条件,更易于对糙率进行更为全面深入的研究[2-3]。


多年以来,有许多学者[4-9]从分析糙率与关键水力要素的相关关系出发,力求推导出普遍适用的糙率经验公式,但取得的成果有限。随着计算机技术的发展,有学者打破糙率研究的传统思维方式,通过构建数学模型进行糙率预测并取得丰硕成果。 Becker 等[10-11]提出将改进的单纯形算法用于糙率数学模型的建立,金忠青等[12-13]采用复合形法构建河网糙率预测模型,程伟平等[14-15]引入广义逆理论及带参数的卡尔曼滤波构建糙率预测模型,雷燕等[16]运用遗传算法建立糙率数学模型,辛小康等[17]对遗传算法优化构建预测模型,涨潮等[18-19]基于 BP 神经网络并对算法进行改进构建糙率数学模型。虽然糙率预测模型依旧在不断完善创新,但仍存在多种限制因素,例如模型需大量样本数据进行学习训练且运算效率较低,极易陷入局部最优状态,而且模型参数的选择难度较大将会影响计算精准度。最小二乘支持向量机(Least Square Support Vector Machine,简称 LSSVM)是由 Suykens 等[20-22]提出的对标准支持向量机( Support Vector Machine, 简称 SVM) [23]的改进优化,除拥有 SVM 解决小样本、非线性、避免陷入局部极值、参数寻优方法简便等优势外,又通过在目标函数中引入误差平方和项进一步降低计算复杂度提高运算效率,减小 SVM 迭代误差可能对算法精度产生的影响。本文提出应用 LSSVM 进行人工加糙渠道糙率预测,并预先对多个主要影响因素进行偏最小二乘( Partial Least Squares,简称 PLS) [24]分析,提取影响糙率的重要成分,降低无关成分及变量间不独立对模型的影响。


因此,本文采用 PLS 法对数据预处理,结合 LSSVM 建立模型,构建基于偏最小二乘及最小二乘支持向量机(简称 PLS-LSSVM)的人工加糙渠道糙率预测模型。并以某矩形人工加糙渠道为例进行模型训练及预测,验证模型可靠性及适用性。


1

基于偏最小二乘及最小二乘支持向量机的人工加糙渠道糙率预测模型研究(葛赛,赵涛等)

模型算法原理


1.1

偏最小二乘(PLS)算法



偏最小二乘是一种用于多元统计数据分析的新型算法,在消除变量间相关性问题及提取变量的重要信息方面表现突出,综合了典型相关分析、主成分分析及多元线性回归分析在数据分析处理方面的优势于一体。根据本文实际情况,针对多自变量及单因变量进行研究,假设样本数为 m,自变量个数为 n,

基于偏最小二乘及最小二乘支持向量机的人工加糙渠道糙率预测模型研究(葛赛,赵涛等)

算法具体计算步骤如下:


进行数据标准化处理。为将数据的不同特征以相同的尺度来表示,减小不同变量在量纲及数量级差异上对数据信息的影响,对自变量 X 与因变量 y 进行标准化处理。


基于偏最小二乘及最小二乘支持向量机的人工加糙渠道糙率预测模型研究(葛赛,赵涛等)
基于偏最小二乘及最小二乘支持向量机的人工加糙渠道糙率预测模型研究(葛赛,赵涛等)


提取成分。自变量矩阵 X 为多变量,对矩阵 X 提取成分 t1。其中, t1 应最大限度的承载矩阵 X 的相关变异信息情况,且 t1 需满足公式:

基于偏最小二乘及最小二乘支持向量机的人工加糙渠道糙率预测模型研究(葛赛,赵涛等)
基于偏最小二乘及最小二乘支持向量机的人工加糙渠道糙率预测模型研究(葛赛,赵涛等)


1.2

最小二乘支持向量机(LSSVM)算法


最小二乘支持向量机是标准支持向量机的一种优化算法,通过用等式约束代替不等式约束,将误差平方和损失函数作为训练集的经验损失,把较难处理的二次规划问题转化为对线性方程组的求解问题。与标准支持向量机所建模型相比,最小二乘支持向量机收敛精度及运算效率方面具有绝对优势。内部算法原理如下:


设样本训练集为{ xi, yi}, xi∈Rd, yi∈R,( i=1,2,…n; d 为 Rd 空间的维数)。针对非线性问题,引入非线性映射,将样本数据从原空间映射到高维特征空间,构造出线性回归函数:


基于偏最小二乘及最小二乘支持向量机的人工加糙渠道糙率预测模型研究(葛赛,赵涛等)


通过引入拉格朗日函数进行优化目标函数问题的求解,得到:


基于偏最小二乘及最小二乘支持向量机的人工加糙渠道糙率预测模型研究(葛赛,赵涛等)
基于偏最小二乘及最小二乘支持向量机的人工加糙渠道糙率预测模型研究(葛赛,赵涛等)


求解该线性方程组得到 a 和 b,则线性回归函数为:

基于偏最小二乘及最小二乘支持向量机的人工加糙渠道糙率预测模型研究(葛赛,赵涛等)


2

基于偏最小二乘及最小二乘支持向量机的人工加糙渠道糙率预测模型研究(葛赛,赵涛等)

基于 PLS-LSSVM 的人工

加糙渠道糙率预测模型


2.1

PLS-LSSVM 模型



在处理实际工程问题时,经常会遇到存在多种影响因素的情况,直接将数据带入到模型中不仅会干扰模型计算的精度,甚至可能会严重影响模型运算效率。偏最小二乘 PLS 法通过对原变量进行预处理,提取出反映变量信息的重要成分,这些新提取的成分包含了原变量的所有信息,且各个成分间相互独立,消除了原变量间存在的线性相关的情况,同时,重要成分的个数小于原变量的个数,实现了对原数据组的降维。最小二乘支持向量机 LSSVM 是一种优质的机器学习方法,其可通过对训练集进行学习训练,掌握事物内部的变化规律,从而对测试集做出客观合理的预测。偏最小二乘及最小二乘支持向量机 PLS-LSSVM 模型是将偏最小二乘 PLS 与最小二乘支持向量机 LSSVM 相结合,首先运用 PLS 法对样本数据进行预处理,并将预处理提取的重要成分作为 LSSVM 的输入,以减小模型对数据的识别难度,进一步发挥 LSSVM 在预测方面的优势。


2.2

人工加糙渠道糙率物理模型



某人工渠道长 20 m、 宽 0.4 m、深 0.3 m,断面形状为矩形,底坡为可自动调节装置,采用 PVC 材质制作。 试验系统由供水装置、静水箱、可进行坡度调节的渠道、尾门、量水堰、回水装置等组成, 试验系统见图 1。测量段选取去除渠道首尾各 3 m 的中间部分,每间隔 1 m 作为一个测量断面,每个断面布设左、中、右三个测点。渠道通过保持光滑壁面条件及在底部、两侧粘贴粒径 d 为 1~2 mm、 2~3 mm、 3~5 mm 砂粒的方式,模拟出绝对粗糙度Δ 为 0.015 mm、 1.5 mm、 2.5 mm、 4.0 mm 的 4 种不同边壁条件。在满足某一边壁条件下,调节 0.004~0.03 共 8 种不同底坡,设置 12~41 L/s 共 10 组不同流量, 采用水位测针量测每个测点的水深从而得出渠道的平均水深,根据相关已知条件计算得到各关键水力要素及糙率值,试验共获得 320 组试验数据。


基于偏最小二乘及最小二乘支持向量机的人工加糙渠道糙率预测模型研究(葛赛,赵涛等)



2.3

基于 PLS-LSSVM 的人工加糙渠道糙率预测模型建立



划分训练集及测试集。由前期研究成果[25-26]可知,影响人工加糙渠道糙率的主要因素间存在相关性,冗余信息会对预测模型产生干扰。将绝对粗糙度 Δ( x1)、佛汝德数 Fr( x2)、渠道平均水深 h( x3)、底坡 i( x4)作为 PLS-LSSVM 模型的自变量,人工加糙渠道糙率 n值( y)作为 PLS-LSSVM 模型的因变量, 构成数据矩阵 A 为 320 5。将 320 组样本数据随机选取 240 组作为训练集,其余 80 组数据作为测试集。


基于偏最小二乘及最小二乘支持向量机的人工加糙渠道糙率预测模型研究(葛赛,赵涛等)


选取核函数及参数。将径向基函数(Radial Basis Function,简称 RBF)作为核函数,其在此模型条件下表现出较其他核函数更为出色的泛化能力,并且已在许多领域广泛应用。采用交叉验证法进行参数寻优,得到正则化参数 γ=618.9333,核参数 σ2=0.1379。


模型训练预测。对已构建好的 PLS-LSSVM 模型进行学习训练,并对测试集进行预测。选取平均绝对百分比误差 MAPE 及均方根误差 RMSE 作为模型精确性度量标准,反映预测值和观测值之间的偏差程度,对预测结果可靠性进行评价。公式分别如下:

基于偏最小二乘及最小二乘支持向量机的人工加糙渠道糙率预测模型研究(葛赛,赵涛等)


2.4

基于 PLS-LSSVM 的人工加糙渠道糙率预测模型结果及分析



采用 PLS 法对人工加糙渠道糙率相关样本数据进行预处理,并将预处理后的结果作为LSSVM 的输入。通过对组合模型 PLS-LSSVM 进行学习训练,在模型掌握事物相应的内部规律后,对测试集做出预测。为验证组合模型的预测精度,将预测结果分别与单独使用 PLS、LSSVM 模型的预测结果进行对比,同时,为更进一步说明预测模型的优势,将模型预测效果与公式法的预测效果进行对比。借鉴李榕[27]基于量纲分析法及利用大量的试验数据推求的适用于明渠均匀流的糙率回归方程形式,如式( 23)所示,通过拟合可知,式(23)中的系数 n0 及α与底坡 i 具有良好的对数函数关系。拟合得到的 4 种不同边壁条件下的系数 n0及α如表 1 所示, 并将其分别带入式(23)中进行糙率预测,总的预测效果对比如图 2 及表 2 所示。


基于偏最小二乘及最小二乘支持向量机的人工加糙渠道糙率预测模型研究(葛赛,赵涛等)


基于偏最小二乘及最小二乘支持向量机的人工加糙渠道糙率预测模型研究(葛赛,赵涛等)
基于偏最小二乘及最小二乘支持向量机的人工加糙渠道糙率预测模型研究(葛赛,赵涛等)


基于偏最小二乘及最小二乘支持向量机的人工加糙渠道糙率预测模型研究(葛赛,赵涛等)


基于偏最小二乘及最小二乘支持向量机的人工加糙渠道糙率预测模型研究(葛赛,赵涛等)


在明渠水流的水力计算中,对糙率取值的精度要求较为严格。采用 PLS 法进行糙率预测,预测数据的平均绝对百分比误差 MAPE 为 7.69%,均方根误差 RMSE 为1.10*10^3 ,而采用公式法进行糙率预测,预测数据的平均绝对百分比误差 MAPE 为 4.81%,均方根误差RMSE 为8.39*10^4,预测精度较 PLS 法有了一定程度的提升。 LSSVM 模型预测数据的平均绝对百分比误差 MAPE 为 2.90%,均方根误差 RMSE 为 4.01*10^4 ,与公式法的预测结果相比,在预测精度方面有了进一步的提升,但 LSSVM 模型将样本数据直接作为模型的输入,可能会对模型训练产生干扰从而影响预测结果。 PLS-LSSVM 模型融合了 PLS 及 LSSVM 模型的优点,预测数据的平均绝对百分比误差 MAPE 为 1.38%,均方根误差 RMSE 为2.24*10^4 ,预测性能较单独使用 LSSVM 模型有了更进一步的提升。由此可见,在对人工加糙渠道的研究过程中, PLS-LSSVM 模型相对于 PLS、 LSSVM 模型及公式法来说,更适合用于进行人工加糙渠道糙率方面的相关预测。


2.5

不同变量组合下的 PLS-LSSVM 模型预测效果对比



以在人工加糙渠道糙率预测方面表现良好的 PLS-LSSVM 作为预测模型,基于上文选用的作为模型输入的自变量组合形式: 绝对粗糙度 Δ(x1)、佛汝德数 Fr(x2)、渠道平均水深h(x3)、底坡 i(x4),尝试另外 3 种自变量组合形式: 绝对粗糙度 Δ(x1)、佛汝德数 Fr(x2)、渠道平均水深 h(x3), 绝对粗糙度 Δ(x1)、渠道平均水深 h(x2)、底坡 i(x3), 绝对粗糙度Δ(x1)、渠道平均水深 h(x2)进行模型的训练及预测,不同变量组合下的预测效果对比如表 3 所示。


基于偏最小二乘及最小二乘支持向量机的人工加糙渠道糙率预测模型研究(葛赛,赵涛等)



从表 3 中可以看出,新选用的 3 种变量组合形式下模型预测精度均低于原变量组合形式下的预测精度。其中,同时去除变量 Fr、 i 的组合形式对模型预测精度影响最大,去除变量Fr 比去除变量 i 的组合形式对模型预测精度的影响更大。


3

基于偏最小二乘及最小二乘支持向量机的人工加糙渠道糙率预测模型研究(葛赛,赵涛等)

结论


(1)

文章采用偏最小二乘及最小二乘支持向量机 PLS-LSSVM 模型,进行人工加糙渠道糙率的相关预测。对影响人工加糙渠道糙率的主要因素进行 PLS 重要成分的提取,消除变量间的多重相关性,综合全面描述事物的本质因素,并将提取的重要成分作为最小二乘支持向量机 LSSVM 的输入,减小数据对模型的干扰,更有助于模型的训练及预测。


(2)

预测结果显示,PLS-LSSVM 模型预测数据的平均绝对百分比误差 MAPE 为 1.38%,均方根误差 RMSE 为 2.24*10^4 ,优于单独使用 PLS 模型、公式法的预测效果,较优于单独使用 LSSVM 的预测效果。 PLS-LSSVM 模型综合了 PLS、 LSSVM 各自的优势性能,进一步提高了预测精度。


(3)

选取更为合理的糙率,提高明渠水流水力计算的精度,不仅有利于渠道正常投入运行,更有利于对其进行科学的规划与管理。选取适用的自变量组合形式,基于 PLS-LSSVM模型进行渠道糙率预测,具有良好的应用前景。


基于偏最小二乘及最小二乘支持向量机的人工加糙渠道糙率预测模型研究(葛赛,赵涛等)
基于偏最小二乘及最小二乘支持向量机的人工加糙渠道糙率预测模型研究(葛赛,赵涛等)


基于偏最小二乘及最小二乘支持向量机的人工加糙渠道糙率预测模型研究(葛赛,赵涛等)



参考文献略


本文内容为录用首发版,定稿请参见《南水北调与水利科技》刊文。

本期编辑: 阿丹、海超、檬檬               


免责声明:遵循微信公众平台关于保护原创的各项举措。推送文章可能未能事先与原作者取得联系,或无法查证真实原作者,若涉及版权问题,请原作者留言联系我们。经核实后,我们会及时删除或者注明原作者及出处。

基于偏最小二乘及最小二乘支持向量机的人工加糙渠道糙率预测模型研究(葛赛,赵涛等)

《南水北调与水利科技》

共筑学术交流新天地 同谱人水和谐新篇章

以上是关于基于偏最小二乘及最小二乘支持向量机的人工加糙渠道糙率预测模型研究(葛赛,赵涛等)的主要内容,如果未能解决你的问题,请参考以下文章

求助半监督最小二乘支持向量机的MATLAB程序

LSSVM回归预测基于matlab天鹰算法优化最小二乘支持向量机AO-LSSVM数据回归预测含Matlab源码 1848期

LSSVM回归预测基于matlab天鹰算法优化最小二乘支持向量机AO-LSSVM数据回归预测含Matlab源码 1848期

基于最小二乘的孪生有界支持向量机分类算法

支持向量机之最小二乘(LS)-------6

技术文献基于全局优化支持向量机的多类别高炉故障诊断