logo资料库

基于PSO优化BP神经网络的水质预测研究 .pdf

第1页 / 共7页
第2页 / 共7页
第3页 / 共7页
第4页 / 共7页
第5页 / 共7页
第6页 / 共7页
第7页 / 共7页
资料共7页,全文预览结束
5 10 15 20 25 30 35 40 中国科技论文在线 基于 PSO 优化 BP 神经网络的水质预测研究# http://www.paper.edu.cn 高峰,冯民权** (西安理工大学 陕西省西北旱区生态水利工程重点实验室 陕西 西安 710048) 摘要:为快速准确预测河流水质,本文结合汾河实际监测数据,使用粒子群算法优化 BP 神经网络模型 (PSO-BP)进行水质预测研究。通过灰色关联度分析确定输入变量,利用 PSO 算法修正 BP 网络的初始权值、 阈值,优化神经网络结构及算法全局收敛性。采用该模型对汾河的主要污染物指标 COD、BOD5、氨氮、 挥发酚等进行预测和验证。结果表明:同传统的 BP 神经网络模型相比,PSO-BP 模型使最大相对误差从原 来的 15.43%大幅度减少到 1.46%,其平均误差变化由原来的 4.00%改善到 1.01%,预测均方根误差从 1.605×10-4 增大到 5.956×10-3。因此,基于 PSO-BP 神经网络模型的预测更加精确,该模型可有效用于水 质预测。 关键词:环境工程学;粒子群算法;水质;灰色关联度;预测 中图分类号:X522 Prediction of water quality by BP neural network based on PSO GAO Feng, FENG Minquan Xi’an Shaanxi 710048) (State Key Laboratory of Eco-Hydraulic Engineering in Shaanxi , Xi’an University of Technology, Abstract: In order to quickly and accurately predict river water quality, in this paper, the model was used for water quality prediction, which is particle swarm algorithm to optimize the BP neural network. This study combined with actual monitoring data of Fenhe. Input variable was confirmed through the grey correlation analysis. PSO algorithm corrected the initial weights and thresholds of BP neural network,and then optimized structure and algorithm of neural network. The model predicted and verified main pollutants index of Fenhe for COD, BOD5, NH3-N and Volatile Phenol, etc. It showed that the maximum relative error sharply decreased from 15.43% to 1.46% compared with the traditional BP neural network model,the average error improved from 4.00% to1.01%, Root-Mean-Square Error of Prediction (RMSEP) was from up to .Therefore, prediction was more accurate based on PSO-BP neural network model. This model could be effectively used for water quality prediction. Key words: environmental engineering; PSO algorithm; water quality; grey relational; prediction 0 引言 河流水质预测是研究河流水质污染的重要手段之一,对水质参数进行精准预测,及时掌 握水质动态变化趋势,具有重要的理论价值和现实意义。国内外学者采用数理统计、灰色系 统理论、水质模拟模型、人工神经网络等[1-6]方法对水质预测做了大量工作,并取得了一定 的成果。但是上述方法易陷入局部极小点、过学习与欠学习、维数灾难、泛化能力差等[7,8] 缺陷,尤其对小样本数据进行预测时,其预测结果很难令人满意。 粒子群算法(PSO)是一种群体智能优化算法,目前被广泛应用于各种优化问题[9-11],特 别是与其它算法相结合,已成为预测领域中的研究热点,徐龙琴[12]等针对支持向量机(SVR) 参数以及核函数参数选取计算量大,时间复杂度高,不易获取适宜的参数组合的缺点,将其 基金项目:高等学校博士学科点专项科研基金博导类资助课题(20126118110015) 作者简介:高峰(1986—),男(汉族),博士研究生,主要研究方向:水环境模拟与污染控制研究 通信联系人:冯民权(1964—),男,教授,主要研究方向:水环境模拟与污染控制研究,. E-mail: mqfeng@xaut.edu.cn - 1 -
中国科技论文在线 http://www.paper.edu.cn 与粒子群算法相结合,建立了粒子群优化加权支持向量机水质预测模型,增强了 SVR 的适应 能力,同时改善了预测精度和稳定性;虞英杰[13]等针对 BP 神经网络模型在训练和测试中易 陷入局部最优的缺点,将其与粒子群算法结合,预测水体中叶绿素 a 浓度,增强了 BP 网络 45 的泛化能力,优化了全局收敛性,提高了预测精度。本研究在前人已有工作的基础上,首先 对水质监测数据进行归一化处理,应用灰色关联分析对样本数据进行维归约,确定 BP 网络 的输入节点,增强网络的适应能力;为了改善网络的全局收敛性,提高预测精度,本研究采 用粒子群算法对 BP 神经网络进行优化,以期得到更好的预测结果。 1 理论方法 50 1.1 粒子群算法优化 BP 神经网络预测模型的建立 粒子群算法优化 BP 神经网络分为 BP 网络结构确定、粒子群算法、BP 神经网络预测 3 个部分。粒子群算法优化 BP 神经网络的权值和阈值,粒子群算法的适应函数由神经网络训 练样本集的输出误差给出,个体通过适应度函数计算个体适应值[14],适应值越小表明微粒 在移动搜索过程中有更好的性能。网络权值的优化过程是一个反复迭代过程,通过不断改变 55 微粒在权值空间内的位置来得到输出层的最小误差,改变微粒速度以更新网路权值,减少均 方差误差(MSE)。在权值优化过程中,对每一次的优化都必须要对给定训练样本集进行分类, 保证每次训练时的样本集都不同,以提高神经网络的泛化能力。BP 神经网络用粒子群算法 得到最优个体对网络初始权值和阈值赋值,使优化后的 BP 神经网络经训练后能够更好的预 测函数输出。 60 1.2 PSO 优化 BP 神经网络算法流程 粒子群算法优化 BP 神经网络算法流程如图 1 所示。首先,将样本空间归一化,一部分 作为训练样本,另一部分作为预测样本。其次,适应度值由 BP 神经网络训练集输出误差给 出,确定 Gbest 和 Lbest,直至 Gbest 的误差小于预定误差△,输出最优值至 BP 网络部分。 最后,由给定的最优初始权值阈值进行 BP 神经网络预测。 - 2 -
中国科技论文在线 http://www.paper.edu.cn 确定输入 变量节点数 初 始 网 络 权 值阈值长度 获取最优 权值阈值 计算误差 B P 网 络 部 分 阈值权值更新 Y N 满足条件 Y 得到结果 产生初始 微粒群 向量映射, 组成网络 选择训练 样本集 计算其 适应值 P S O 算 法 F1<△ N 确定 Gbest 和 Lbest 粒群更新 65 70 图 1 PSO 优化 BP 神经网络算法流程图 Fig.1 Fow chart of PSO optimizing BP neural network 2 PSO 优化 BP 神经网络在汾河水质预测中的应用 汾河运城段自新绛南梁入境至万荣庙前汇入黄河,区段流长 109km。汾河运城段设有两 处监测断面,分别是新绛站里监测断面及河津大桥监测断面,主要监测上游来水以及汇入黄 河时的水质状况。据有关部门统计,2008 年河津断面监测结果:CODcr 超标 1.36 倍,BOD5 超标 2.89 倍,氨氮超标 13.75 倍,总磷超标 0.22 倍,近年来水质并没有改善很多,水体污 染严重,断流情况较重,河槽萎缩,大量依赖水生环境的生物失去生存环境,物种多样性降 低,河道生态退化。因此选此段河流进行水质预测对于该河段水质治理有重要意义。 75 2.1 研究数据 本研究样本集数据来源于汾河河津大桥监测断面 2005 年-2010 年枯水期月监测资料, 监测项目有:氨氮、挥发酚、水温、石油类、DO、BOD5 等地表水常规监测项目。 2.2 网络变量选择 该研究基于 PSO-BP 神经网络对汾河运城段水质预测,汾河运城段污染多为有机物污染, 80 COD 作为有机物相对含量的综合指标,对其进行分析,可了解汾河运城段水污染变化趋势。 所以把 COD 作为 BP 神经网络的输出变量。 输入变量的选取主要取决于已有的样本数据,但是不可能把所有的水质指标都作为输入 变量,这不但会增加预测模型的复杂度,造成算法在时间和空间上的浪费,而且得不到较好 - 3 -
中国科技论文在线 http://www.paper.edu.cn 的预测效果[13],因此我们只能选取和输出变量关联度较好的指标作为网络输入。对所有水 85 质指标进行灰色关联性分析[15],最终选择关联度较高的氨氮、挥发酚、水温、BOD5 以及 COD 为输入变量。监测数据如下表 1: 表 1 2005 年-2010 年枯水期河津大桥监测断面月平均水质监测数据 Table1 Monthly average water quality monitoring data at monitored section of Hejing Bridge in drought period from 2005 to 2010 序号 监测时间 水温/°C 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 2005 年 1 月 2005 年 2 月 2005 年 3 月 2005 年 4 月 2005 年 12 月 2006 年 1 月 2006 年 2 月 2006 年 11 月 2006 年 12 月 2007 年 1 月 2007 年 2 月 2007 年 3 月 2007 年 4 月 2007 年 11 月 2007 年 12 月 2008 年 1 月 2008 年 2 月 2008 年 3 月 2008 年 4 月 2008 年 11 月 2008 年 12 月 2009 年 1 月 2009 年 2 月 2009 年 3 月 2009 年 4 月 2009 年 11 月 2009 年 12 月 2010 年 2 月 2 1 9 14 6.6 8 10.5 14.8 4.2 3 3 6 20 11 4.3 4 0.5 12.8 16 14 6 0.7 6 6.5 21 10 6 7.2 COD 115.75 122.51 150.73 118.92 162 141.12 165.22 106.93 165.67 188 148 116 191.48 82.22 136 145.02 97.54 109.07 128.37 88 108 97.6 84.9 111 118 31.2 82 94 污染因子浓度/(mg•L-1) BOD5 32.2 32.2 38.2 28.2 37.2 35.2 41.2 23.2 32.2 42.2 38.2 30.2 53.2 21.3 22 49.2 49.2 43.5 45.2 31.2 39.2 33.2 35.2 41.4 47.2 13.2 17.5 21.5 氨氮 30.1 21.3 23.5 15 21.3 25.4 15.6 26.5 19.6 21 19.3 27.2 21.7 18.2 20.3 25.2 29.8 26.7 34.4 30.4 26.3 20.5 26.5 30 25.8 22.2 26.4 17.4 挥发酚 0.013 0.0194 0.0082 0.061 0.056 0.051 0.042 0.02 0.0376 0.0533 0.055 0.069 0.095 0.062 0.057 0.098 0.057 0.071 0.115 0.009 0.009 0.019 0.029 0.057 0.067 0.036 0.028 0.025 90 2.3 模型验证 利用已建立的 PSO-BP 网络预测模型对汾河运城段进行验证,选取 2005-2009 年的 24 个样本为训练样本集。构建 PSO-BP 神经网络模型,经过反复测试隐层节点数为 5 个,即包 含 5 个节点的输入层,代表氨氮、挥发酚、水温、BOD5 以及 COD;5 个节点的隐层;1 个节 点的输出层,代表 COD。对训练样本集进行训练,PSO 算法进化次数为 100 次,适应度值达 95 到 0.0014,使其收敛并有较高精度,进化过程如图 2。表现出对 BP 神经网络良好的训练效 果,得到一套适合汾河运城段 COD 预测的最优权值和阈值,其值由表 2 给出,COD 模拟值和 实测值比较如图 3,其相对误差如图 4 所示。由图 4 可看出该模型训练样本集的相对误差均 小于 5.5%,说明该模型的泛化能力较强。一般认为,水质模拟相对误差在 30%以内较好,因 此该模型模拟精度很好。 - 4 -
中国科技论文在线 http://www.paper.edu.cn 200 180 160 140 120 100 80 60 ) L / g m ( / 度 浓 D O C 预测值 实测值 0 5 15 10 样本序号 20 25 0.1 0.09 0.08 0.07 0.06 0.05 0.04 0.03 0.02 0.01 0 值 度 应 适 100 0 10 20 30 40 50 60 70 80 90 100 进化代数 图 2 适应度变化曲线 图 3 1-24 号样本 COD 模拟值和实测值比较 Fig.2 The curves of fitness Fig.3 Comparison of observed and measured 105 表 2 PSO 算法得到的最优权值和阈值 Table 2 the optimal initial weights and threshold values from PSO algorithm of 1-24 samples 权值 输入 1 输入 2 输入 3 输入 4 输入 5 阈值 输出节点 权值 输出节点 ) % ( / 差 误 对 相 阈值 6 5 4 3 2 1 0 -1 -2 -3 0 隐层节点 1 隐层节点 2 隐层节点 3 隐层节点 4 隐层节点 5 0.653402 1 0.096566 -0.26409 -0.19737 0.105558 0.105558 0.49509 -0.28697 -0.11429 0.435853 0.208985 0.040629 0.040629 -0.29874 -0.00582 -0.83718 -0.36722 0.099732 -0.24206 -0.24206 -0.08298 120 110 100 90 80 70 60 50 40 30 ) L / g m ( / 值 度 浓 D O C 25 5 10 15 样本序号 20 25 -0.08937 0.115018 -0.08076 -0.02173 0.032635 -0.33949 -0.33949 -0.47386 0.315859 -0.03101 -0.25185 0.340477 0.041483 0.041483 预测值 实测值 26 27 样本序号 28 图 4 1-24 号样本的相对误差 图 5 预测值与实测值比较 Fig.3 The relative error of 1-24 samples Fig.5 Comparison of predicted and measured 2.4 模型预测及分析 110 应用已训练好的 PSO-BP 神经网络模型进行预测,预测样本集为 2009 年 4 月、11 月、 12 月以及 2010 年 2 月 4 个独立样本。预测结果如表 3 所示。在同样的模型下,给出了以 BOD5、 氨氮、挥发酚等 3 个指标各自为输出变量时的预测结果,结果如表 4 所示。 - 5 -
中国科技论文在线 http://www.paper.edu.cn 表 3 给出了基于 PSO-BP 神经网络模型和传统 BP 神经网络模型汾河运城段的水质预测结 果及相对误差,可以看出基于 PSO-BP 神经网络模型的预测结果更加切合实际,虽然在样本 序号 25、28 处,相对误差高于传统 BP 神经网络模型[15],但是在这两处的误差差距不大, 是能够接受的。而在样本序号 26 处,相对误差从 15.43%改善到 1.46%,有大幅度降低。由 表 3 可得到 PSO-BP 模型的平均误差为 1.01%要低于传统 BP 神经网络模型的 4.00%,同时 PSO-BP 模型的预测均方根误差为 1.605 × 410 − ,而传统 BP 神经网络模型的预测均方根误差为 − 5.956 310 × ,预测均方根误差也有了很大改善。因此,基于 PSO-BP 神经网络模型的预测更 加精确。 115 120 表 3 COD 预测结果及误差分析 Table 3 predicted results of COD and error analysis 序号 监测时间 25 26 27 28 2009 年 4 月 2009 年 11 月 2009 年 12 月 2010 年 2 月 COD 实测值 /(mg·L-1) 118 31.2 82 94 PSO-BP 模型 传统 BP 模型 COD 预测值 /(mg·L-1) 117.5756 31.6555 81.8402 92.0902 相对误差/ (%) 0.36 1.46 0.19 2.03 COD 预测值 /(mg·L-1) 117.8896 36.0142 82.2074 93.7907 相对误差 (%) 0.0936 15.43 0.2529 0.2227 表 4 其它指标预测结果及误差分析 Table 4 predicted results of other indicators and error analysis 125 序号 监测时间 25 26 27 28 2009 年 4 月 2009 年 11 月 2009 年 12 月 2010 年 2 月 BOD5 实测值 /(mg·L-1) 47.2 PSO-BP 模型 COD 预 测值 /(mg·L-1) 48.5216 相对误差/ (%) 2.8 氨氮实 测值 /(mg·L-1) PSO-BP 模型 氨氮预 测值 /(mg·L-1) 相对误 差(%) 挥发酚实 测值 /(mg·L-1) PSO-BP 模型 挥发酚预 测值 /(mg·L-1) 相对误差 (%) 25.8 25.7510 0.19 0.067 0.0641 13.2 13.3148 0.87 22.2 21.3409 3.87 0.036 0.0355 17.5 17.7800 1.6 26.4 26.4422 0.16 0.028 0.0296 21.5 21.4162 0.39 17.4 16.9841 2.39 0.025 0.0248 4.28 1.39 5.55 0.76 由表 4 可知 BOD5、氨氮、挥发酚等 3 个指标的预测误差为:0.39~2.8%、0.16%~3.87%、 0.76~5.55%,最大相对误差出现在挥发酚序号 25 处为 5.55%。结果表明该模型在输入、输 出变量改变的情况,模拟的误差虽然较 COD 大,但是依然很精确,说明该模型有良好的泛化 能力和稳定性。 3 结论 130 本文充分利用 PSO 的全局搜索能力和 BP 神经网络的非线性拟合能力的特点,所建立的 水质预测模型在小样本预测中也能保持较高的预测精度,具有较强的泛化能力和实用性。 (1)根据汾河运城段实际监测数据,建立了 PSO-BP 神经网络模型,对 COD、BOD5、氨氮、 挥发酚等进行预测,预测结果表明该模型具有良好的泛化能力和稳定性; 135 (2)以 COD 为例,将预测结果与传统 BP 神经网络模型相比,结果显示:PSO-BP 模型使 最大相对误差从原来的 15.43%大幅度减少到 1.46%,其平均误差变化由原来的 4.00%改善到 1.01%,均方根误差由 1.605 × 410 − 改善到 5.956 × 310 − 。表明,基于 PSO-BP 神经网络模型比 传统 BP 神经网络模型有更好的预测精度; - 6 -
中国科技论文在线 http://www.paper.edu.cn (3)本文构建的 PSO-BP 神经网络模型可应用于其他河流的水质预测。动态 PSO 算法与其 他神经网络的结合在动态变化的反馈预测方面有更大的潜力,应是今后研究的重点。 [参考文献] (References) [1] OH H M,AHN C Y,LEE J W,al.Community patterning and identification of predominant factors in algalbloom in Daechung Reservoir(Korea) using artificial neural networks[J].Ecol Model,2007,203:109-118. [2] ZHANG Zhi(张志). Study on Artificial Neural Network Model for Water Quality Prediction [J]. Acta Scientiarum Naturalium Universitatis NeiMongol (内蒙古大学学报(自然科学版)),2006,37(6):703-707. [3] YUAN Honglin(袁宏林),GONG Ling(龚令). Forecasting the water quality index in Zaohe river based on BP neural network model [J]. Journal of Safety and Environment (安全与环境学报),2013,4(2):106-110. [4] GUO Liang(郭亮),WANG Peng(王 鹏), et al. Water quality forecast through application of BP neural network at Sifangtai [J]. Journal of Harbin Institute of Technology (哈尔滨工业大学学报),2009,41(6):62-66. [5] LIU Dongjun(刘东君),ZOU Zhihong(邹志红). Application of weighed combination model on forecasting water quality[J].Acta Scientiae Circumstantiae(环境科学学报).2012,32(12):3128-3132. [6] WU Chengxuan(吴承璇),ZHANG Yingying(张颖颖), et al.Water Quality Parameter Prediction using Neural Network Based on time Series[J].Water Resources and Power(水电能源科学).2013,31(2):47-49. [7] ZHAO Shixin(赵世新),ZHANG Chen(张晨),et al. Predicted water-quality evaluation of Lihe sector in Luanhe diversion to Tianjin water project based on BP neural network [J]. Journal of Safety and Environment (安全与环 境学报),2010,10(2):63-96. [8] BAI Ji-zhong, YANG Jian-ming, FENG Min-quan. Study on the water environmental capacity and the sewage control of the Sushui River[C]. MSIT2011, 2011, 9: 995-1001. [9] GAO Shang(高尚),YANG Jingyu(杨静宇).Research on Chaos Particle Swarm Optimization Algorithm[J]. Pattern Recognition and Artificial (模式识别与人工智能)[J].2006,19(2):266-270. [10] WANG Wenjuan(王文娟),CAO Junxing(曹俊兴), et al. Reservoir Parameter rediction of Neural network based on Particle swarm Optimization [J]. Journal of Southwest Petroleum University ( 西 南 石 油 大 学 报),2007,29(6):31-34. [11] LI Zuiyong(李祚泳),WANG Jiayang(汪嘉杨),GUO Chun(郭淳). A New Method of BP Network Optimized Based on Particle Swarm Optimization and Simulation Test [J]. Acta Electronica Sinica ( 电 子 学 报)2008,36(11):2224-2228. [12] XU Longqin(徐龙琴),LIU Shuangyin(刘双印).Study of Short term Water Quality Prediction Model Based on PSO-WSVR[J]Journal of Zhengzhou University(Engineering Science)( 郑 州 大 学 学 报 ( 工 学 版)).2013,34(3):112-116. [13] YU Yingjie(虞英杰),JIANG Weigang(蒋卫刚) ,et al.Prediction of Chlorophyll a by BP Neural Network based on PSO Algorithm[J].Research of Environmental Sciences(环境科学研究).2011,24(5):526-532. [14] WANG Ping(王平),WANG Caiyun(王彩芸), et al. Application of BP ANN optimized by hybrid algorithm based on PSO in wear volume prediction of rail steel[J].Journal of Machine Design (机械设计): 2013,30(8):15-20. [15] FENG Minquan(冯民权) ,et al.Water quality prediction using BP network and Markov model:based on grey incidence analysis[J].Journal of natural disasters(自然灾害学报).2011,10(5):169-175. 140 145 150 155 160 165 170 175 - 7 -
分享到:
收藏