logo资料库

基于神经网络的流域日径流量预测.pdf

第1页 / 共7页
第2页 / 共7页
第3页 / 共7页
第4页 / 共7页
第5页 / 共7页
第6页 / 共7页
第7页 / 共7页
资料共7页,全文预览结束
http://www.paper.edu.cn 基于神经网络的流域日径流量预测 秦国民,孙龙 (河海大学水资源环境学院,江苏 南京 210098) E-mail:no23q@163.com 摘 要:建立了基于 BP 网络的径流预测模型,对神经网络的结构、输入层、隐含层、输出 层神经元数等问题进行了分析和探讨,利用三花间的 1 个子流域多年的日径流资料对其进行 了训练和检验,建立模型进行仿真模拟,通过实测和预测结果的比较,表明模型的效果令人 满意。 关键词:ANN BP 网络模型 径流预测 1. 引言 径流预测在水资源规划管理和水库的运行与管理中都起着重要的作用。进入20世纪90 年代,由于计算机软、硬件的日益成熟,功能迅猛增强,许多凭借于计算机的高速计算功能 而得以发展的人工智能技术,如人工神经网络(Artificial Neural Networks,缩写为ANN)、 遗传算法、模糊逻辑、决策树等在水文科学领域广为应用。ANN是数据驱动模型,是一种 以建立输入输出数据之间的最优数学关系为目标的黑箱子方法。它结构灵活,能很好地反映 径流时间序列的非线性关系[1] 。 ANN的典型形式主要有BP模型,Hopfield模型和Kohonen模型等。其中以BP算法为基础 的前馈神经网络是应用的最广泛的一种网络。在此简单介绍BP神经网络的建模和一个应用 实例。 2. BP 神经网络简介 BP算法是最初由Werbos开发的一种反向传播训练算法,用于求解前馈网络的实际输出 与期望输出间的最小均方差值,而BP网络正是神经网络中一种反向传递并能修正误差的多 层映射网络,通常采用输入层、输出层和隐含层三层结构,层与层之间的神经元采用全互连 的模式,通过相应的网络权系数相互联系,每层内的神经元没有连接。当参数适当时,此网 络能收敛到较小的均方差[2] 。 BP 算法通过误差函数最小化来完成输入到输出的映射,训练过程可分为两个过程:① 输入的信息流从输入层,经隐含层到输出层逐层处理并计算出各神经元的实际输出值,这 一过程称为信息流的正向传递过程。在正向传播过程中样本信号经过 Sigmoid 函数作用逐 层向前传播,每一层神经元的状态只影响到下一层神经元的状态;②计算网络的实际输出 与训练样本期望值的误差,若该误差未达到允许值,根据此误差确定权重的调整量,从后 往前逐层修改各层神经元节点的连接权重,这一过程称为误差的逆向修改过程[3] [4] 。 两个过程完成了一次学习迭代。这种信息的正向传递与根据误差的逆向修改网络权重的 1
http://www.paper.edu.cn 过程,是在不断迭代中重复进行的,直到网络的输出误差逐渐减小到允许的精度,或达到预 定的学习次数。同时需要确定的参数有期望误差、最大循环次数、学习速率、网络的层数、 各层的神经元数以及其相应的激活函数等。三层感知器网络训练的经典 BP 算法网络程序框 图如下: 给定网络参数初始值 给定输入和目标输出向量,并标准化 求隐含层、输出层各神经元输出 求目标值与网络计算输出的误差 E ε≤E Yes 全部 No End Yes No 计算隐含层神经元误差 计算误差梯度 图 1 BP 网络算法程序框图 3. 径流预测模型的建立 3.1 流域资料情况 本文选择黑石关站为研究对象。黑石关站位于黄河的一级支流伊洛河上,是三花区间最 主要的流量站之一,控制流域面积 1373km2,流域内有 5 个雨量站(李村、缑氏、九龙角、 陶花店和黑石关),2 个上游入流站(白马寺和龙门镇)。如图 2 所示。 2
http://www.paper.edu.cn 图 2 黑石关站控制流域图 实测数据为上述水文站点 1986~2000 年共 15 年的日降雨和日流量资料。经过对各雨量 站日雨资料的分析,发现它们的相关性较好,所以将 5 个雨量站的日雨资料算术平均,作为 流域的日降雨量。将所有数据分为三组:1986~1995 年 10 年的数据作为训练样本,对网络 进行训练;1996~1997 年的数据作为检验样本,检验不同结构的网络经训练后的效果,以 确定最后的网络结构;用 1998~2000 年的流量资料进行仿真模拟。 每年的 7~9 月为黑石关站的汛期,所以,本文把全年的数据分成两类:汛期数据(7~ 9 月);非汛期数据(1~6 月和 10~12 月)[5] 。 3.2 数据处理 由于隐含层的激活函数为 Sigmoid 函数: ( ) xf = 1 xe −+ 1 其输出区间为 0~1,实际上它在(0~0.1)和(0.9~1)区间变化缓慢,为使较大的输 入落在神经元激励函数梯度大的区域,使网络的速度更快,将样本数据进行标准化,变换到 (0.1~0.9)区间,设 maxX , minX 为每个输入样本数据的最大值与最小值,则标准化后为: X =′ ( 8.01.0 + XX − ) ( / X min max − X )min 3.3 结构选取 神经网络的结构直接关系到其性能和运行结果,所以合理地选择网络结构建模中是最重 要的一环。实践表明,对于任何复杂的函数,只要在隐含层中有足够数量的神经元,一个三 层 ANN 几乎可以逼近任何函数[2] 。一些研究表明,水文预测问题实际上是函数映射或拟合 问题,三层结构的 BP 网络就能够满足需要,用双隐含层的结构对降雨径流模型问题的意义 不大[6] [7] 。所以本文采用单隐含层的三层 BP 网络。 I. 输入层神经元数的确定 经过相关分析,黑石关站的流量 1, +thQ 与 tP 、 thQ , 、 1, −thQ 、 2 , −thQ 、 3, −thQ 、 tlQ , 、 1, −tlQ 、 3
, −tlQ 、 tbQ , 、 2 1, −tbQ 、 , −tbQ 相关性较好。 tP 为预测日前 1d 的流域日雨量, thQ , 、 2 1, −thQ 、 http://www.paper.edu.cn , −thQ 、 2 3, −thQ 分别为黑石关站前 1d、前 2d、前 3d、前 4d 的日流量, tlQ , 、 1, −tlQ 、 2 , −tlQ 分 别为龙门镇站前 1d、前 2d、前 3d 的日流量, tbQ , 、 前 2d、前 3d 的日流量。 1, −tbQ 、 , −tbQ 分别为白马寺站前 1d、 2 为了区别汛期和非汛期,在输入变量中加入 2 个二进制变量[2] :输入汛期数据时,它 们分别为 0,1;输入非汛期数据时,分别为 1,0。 所以选取输入层神经数为 13,即用以上 13 个输入变量。 II. 隐含层神经元数 隐含层神经元数的选择是 ANN 设计中最为关键也是最难以琢磨的步骤。神经元数量太 少,网络从样本中获取的信息能力就差,不足以概括和体现训练集中的样本规律;神经元数 量过多,又可能把样本中非规律性的噪声等也学会记牢,从而出现所谓过度吻合问题,不但 会降低网络的概化能力,还会增加训练时间。本文先设置网络参数,最大迭代次数 5000, 目标误差为 0.1,再用常用的试错法来确定隐含层神经元数目:在(9,37)区间上取不同的 值,检验样本平均相对误差最小时的神经元数为最终隐含层神经元数。 试算结果如图 3 所示,可见,隐含层神经元数为 19 和 23 时,训练样本和检验样本的平 均误差都小于 10%,网络性能较好,但 19 个隐含层神经元的网络明显比 23 个的简单,故 确定隐含层神经元数为 19。 训练样本 检验样本 ) % ( 差 误 均 平 25 20 15 10 5 0 9 11 13 15 17 19 23 21 25 隐含层节点数 27 29 31 33 35 37 图 3 不同隐含层神经元与网络误差的关系 III. 输出层神经元数 由于本文考虑对所研究区域日流量进行预测,输出层神经元数取为 1,即待预测日的平 均流量。 所以,选定最终的 BP 网络模型的结构为(13-19-1)。 4
4. 模型的应用 4.1 评价指标 用平均相对误差绝对值δ和合格率来评价模型预测的效果。 http://www.paper.edu.cn δ = 1 n n ∑ i 1 = q i y i − y i × %100 式中 iy 为实测流量, iq 为预测流量, n 为实测流量系列的点据数。 合格率是预测值和实测值之差不超过允许误差的次数占全部次数的百分比,参照《水文 情报预测规范》对日流量预测的许可误差要求,取允许相对误差为 20%。 4.2 仿真模拟 确定了模型的结构,训练好其参数以后,用它预测黑石关站 1998~2000 年的日径流过 程,误差和结果如(表 1)和(图 4,图 5)所示。 从表 1 可以看出,三年的合格率都在 80%以上,1999 年大于 85%,达到了甲等预报方 案。说明 BP 模型建模的效果是令人满意的,所建立的模型也是合理的。 表 1 1998~2000 年预测结果 年份 δ(%) 合格率(%) 1998 13.03 83.1 1999 11.7 88.2 2000 14.45 81.4 实测流量 预测流量 241 271 301 331 361 ) s / 3 m ( 量 流 800 700 600 500 400 300 200 100 0 1 31 61 91 121 151 181 211 日数 图 4 黑石关站 1998 年实测和预测径流过程 5
http://www.paper.edu.cn 实测流量 预测流量 1 31 61 91 121 151 181 211 241 日数 271 301 331 361 图 5 黑石关站 2000 年实测和预测径流过程 ) s / 3 m ( 量 流 450 400 350 300 250 200 150 100 50 0 5. 结论 ANN 作为一种非常优越的非线性函数逼近方法,在很好领域得到应用,在水文过程模 拟和预报中也显示出比传统时间序列方法更为有效的特点。本文对三花间流域黑石关站的日 径流预测进行了研究,确定了结构为(13-19-1)的 BP 网络,对 1998~2000 年的日资料进 行仿真计算,得到了较好的预测结果。 与传统的径流预测方法如水文学概念性模型相比较,BP 神经网络模型不必考虑水文现 象的内在过程和其中各因素错综复杂的关系。但它不能对水文现象进行物理解释,其参数也 不具有任何物理意义。网络结构的确定也有一定的主观性,成熟的理论有待于进一步研究。 参考文献 [1] 熊立华,郭生练 等,神经网络在洪水实时预报中的应用研究[J],水电能源科学,2002,20(3),28-31 [2] Hagan, M.T. et al. 神经网络设计[M],戴葵 等,译,机械工业出版社,2005 [3] 谢新民,杨小柳,半干旱半湿润地区枯季水资源实时预测理论与实践[M],中国水利水电出版社,1999 [4] 苑希民,李鸿雁 等,神经网络和遗传算法在水科学领域的应用[M],中国水利水电出版社,2002 [5] 张婧婧,姜铁兵 等,基于人工神经网络的日径流预测[J],水电自动化与大坝监测,2002,26(4): 65-67 [6] Hsu k, Gupta HV and Sorooshian S., Artificial neural network modeling of the rainfall-runoff process[J], Water Resources Research, 1995, 31(10):2517-2530 [7] Wen Wang, Stochasticity, nonlinearity and forecasting of streamflow processes[M], IOS Press, 2006 6
http://www.paper.edu.cn Daily Streamflow Forecasting through Artificial Neural Network Qin Guomin, Sun Long (College of Water Resources and Environment, Hohai University, Nanjing, Jiangsu, China) Abstract This paper focuses on some key problems in application of ANN model. A BP network-based streamflow forecasting model is developed, and used to make daily discharge forecast for a sub-basin in lower Yellow River. By the comparison of calculated and observed data, the result is fairly satisfactory. It is demonstrated that the ANN technique is a powerful tool for hydrological prediction. Key words:artificial neural network, BP network, streamflow forecasting 7
分享到:
收藏