基于数据扩充神经网络模型的日径流预测

Posted 山坡水文土壤前沿瞭望

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了基于数据扩充神经网络模型的日径流预测相关的知识,希望对你有一定的参考价值。

学术简报



题目:

Daily runoff forecasting based on data-augmented neural network model

作 者:

Xiao-ying Bi, Bo Li, Wen-long Luand Xin-zhi Zhou

刊物/日期:

Journal of Hydroinformatics/2020

 01 

摘要





在水资源利用中,准确预测日径流是非常必要的。为了提高预测的准确性,本文采用了一种由卷积层、注意机制、门限循环单元神经网络和回归模型组成的深度神经网络模型——CAGAnet。本文对比了四种模型方法:CAGAnet模型、SVM模型、LSTM以及AM-LSTM模型,结果显示CAGAnet模型最为精确。


 02 

研究背景




 几十年来,人们研究了大量的预测模型,它们可以分为两类:基于物理过程的模型和数据驱动模型。基于物理过程的模型具有可以通过物理过程观测来描述复杂水文过程的优势,但是受制于许多经验假设并需要大量数据。数据驱动模型是基于历史观察的模型。它是一种端到端的模型,直接探索各种历史水文特征与目标之间的关系,而不需要详细的物理过程解释。

    自20世纪70年代开始,数据驱动方法就已开始大量应用于水文气象预测中,然而水文气象与时间序列的关系是非常复杂和不稳定的。近年来,机器学习技术凭借其强大的学习能力和对非线性过程的模型适配能力吸引了广大学者的注意,并衍生出了许多如人工神经网络(ANN)、遗传程序(GP)以及支持向量机(SVM)等模型。后又产生了带有记忆特别是时间驱动的循环神经网络模型(ANN),其中两种变体即为长短时间序列(LSTM)和门限循环单元(GRU)。



 03 

目的方法




研究目的

本研究的目的是将线性插值法与神经网络模型结合构建一个日径流预测模型,以中国西南地区一个日径流变化较大的小流域为实例,研究复合预测模型的准确性。并在数据扩充的基础上,将其与SVM,LSTMAM-LSTM模型对比评估其预测效果。


研究方法

CAGAnetconvolutionallayer, an AM, a GRU and an AR model network)模型。是一个包含卷积层、注意机制、门限循环单元以及自回归模型的神经网络,如图1所示。



图1 模型流程图

  步骤如下:
1 、选择输入变量。
    为了获得更好的预测速度和效果,分别计算了每个测站的历史径流、降水、蒸发和预测期径流的皮尔逊相关系数,如图2所示。



基于数据扩充神经网络模型的日径流预测

图2 皮尔逊相关系数

    结合实际情况以及不同变量的滞后时间,我们筛选出来了六组总计16个迟滞变量,如图3。



基于数据扩充神经网络模型的日径流预测

图3 输入变量筛选

2、将输入数据分为长序列Xi和短序列S。

3、将长序列数据输入CNN层来提取水文数据中的时间分布特点以及变量间的相互依赖性。

4、将3中已提取的数据输入AM层,并根据其相关性加权。核心流程如4所示



基于数据扩充神经网络模型的日径流预测

图4 AM核心步骤

5、将4中已加权的数据输入GRU层,进行非线性预测。结构选择如图5所示。



基于数据扩充神经网络模型的日径流预测

图5 C层和GRU层结构大小选择

6、将短序列数据S输入AR模型以得到线性预测。

7、将线性预测 与非线性预测结果结合成最 终的预测结 果。


 04

预测结果






以下为原数据预测结果、一次数据插补后的预测结果以及两次数据插补后的预测结果,此处仅展示复合模型CAGAnet的折线图。



基于数据扩充神经网络模型的日径流预测

图6 带入原数据的评估指标



基于数据扩充神经网络模型的日径流预测

图7 带入原数据的CAGAnet模型预测结果



基于数据扩充神经网络模型的日径流预测

图8 第一次数据插补后的评估指标



基于数据扩充神经网络模型的日径流预测

图9 带入第一次插补数据的CAGAnet模型预测结果



基于数据扩充神经网络模型的日径流预测

图10 第二次数据插补后的评价指标



图11 带入第二次插补数据的CAGAnet模型预测结果

 05 

结论





    数据结果表明,在不采用数据拓展方法的情况下,CAGAnet模型与单一模型相比拥有更高的精度,纳什效率系数NSE可达0.854。鉴于日尺度时间序列水文数据的不确定性,采用了线性插补的方法来提高数据之间的相关性。经检验,四种模型分别在无插补、插补一次和插补两次的情况下,被看好的CAGAnet模型所预测的效果要更好于其他三种模型,并且运行速度更快。使用插补两次的数据所得出的结果,CAGAnet模型的纳什效率系数NSE为0.993,标准差RMSE2.58,平均绝对误差为0.6。并且纳什效率系数NSE比其他三种模型分别高了12%10%3%




参考文献

①Kratzert, F., Klotz, D., Brenner, C., Schulz, K. & Herrnegger,M. 2018 Rainfall-runoff modelling using Long-Short-Term-Memory (LSTM) networks.Hydrology and Earth System Sciences 22 (11), 6006–6022.     https://doi.org/10.5194/hess-22-6005-2018.

②Wu, Y. R., Liu, Z. Y., Xu, W. G., Feng, J., Shivakumara, P. &Lu, T.

2018 Context-Aware Attention LSTM Network for Flood Prediction. In:2018 24th International Conference on Pattern Recognition (ICPR), Beijing,China, pp. 1301–1306. https:// doi.org/10.1109/ICPR.2018.8545385

③Zhao, Y., Ye, L., Li, Z., Song, X., Lang, Y. & Su, J. 2016 Anovel bidirectional mechanism based on time series model for wind powerforecasting. Applied Energy 177, 793–803. https://doi.org/10.1016/j.apenergy.2016.03.096.





文案万满鑫

排版万满鑫

校核刘佳琪






THE END





以上是关于基于数据扩充神经网络模型的日径流预测的主要内容,如果未能解决你的问题,请参考以下文章

模型工具基于循环神经网络的长时间尺度径流预测方法

月径流预测基于matlab未来搜索算法算法优化BP神经网络月径流预测含Matlab源码 2001期

基于ESMD-BP神经网络组合模型的中长期径流预报

月径流预测基于matlab人工生态系统算法优化BP神经网络月径流预测含Matlab源码 2000期

月径流预测基于matlab海洋捕食者算法优化BP神经网络月径流预测含Matlab源码 2002期

神经网络应用