5
10
15
20
25
30
35
40
中国科技论文在线
基于 PSO 优化 BP 神经网络的水质预测研究#
http://www.paper.edu.cn
高峰,冯民权**
(西安理工大学 陕西省西北旱区生态水利工程重点实验室 陕西 西安 710048)
摘要:为快速准确预测河流水质,本文结合汾河实际监测数据,使用粒子群算法优化 BP 神经网络模型
(PSO-BP)进行水质预测研究。通过灰色关联度分析确定输入变量,利用 PSO 算法修正 BP 网络的初始权值、
阈值,优化神经网络结构及算法全局收敛性。采用该模型对汾河的主要污染物指标 COD、BOD5、氨氮、
挥发酚等进行预测和验证。结果表明:同传统的 BP 神经网络模型相比,PSO-BP 模型使最大相对误差从原
来的 15.43%大幅度减少到 1.46%,其平均误差变化由原来的 4.00%改善到 1.01%,预测均方根误差从
1.605×10-4 增大到 5.956×10-3。因此,基于 PSO-BP 神经网络模型的预测更加精确,该模型可有效用于水
质预测。
关键词:环境工程学;粒子群算法;水质;灰色关联度;预测
中图分类号:X522
Prediction of water quality by BP neural network based on
PSO
GAO Feng, FENG Minquan
Xi’an Shaanxi 710048)
(State Key Laboratory of Eco-Hydraulic Engineering in Shaanxi , Xi’an University of Technology,
Abstract: In order to quickly and accurately predict river water quality, in this paper, the model
was used for water quality prediction, which is particle swarm algorithm to optimize the BP neural
network. This study combined with actual monitoring data of Fenhe. Input variable was confirmed
through the grey correlation analysis. PSO algorithm corrected the initial weights and thresholds
of BP neural network,and then optimized structure and algorithm of neural network. The model
predicted and verified main pollutants index of Fenhe for COD, BOD5, NH3-N and Volatile
Phenol, etc. It showed that the maximum relative error sharply decreased from 15.43% to 1.46%
compared with the traditional BP neural network model,the average error improved from 4.00%
to1.01%, Root-Mean-Square Error of Prediction (RMSEP) was from up to .Therefore,
prediction was more accurate based on PSO-BP neural network model. This model could be
effectively used for water quality prediction.
Key words: environmental engineering; PSO algorithm; water quality; grey relational; prediction
0 引言
河流水质预测是研究河流水质污染的重要手段之一,对水质参数进行精准预测,及时掌
握水质动态变化趋势,具有重要的理论价值和现实意义。国内外学者采用数理统计、灰色系
统理论、水质模拟模型、人工神经网络等[1-6]方法对水质预测做了大量工作,并取得了一定
的成果。但是上述方法易陷入局部极小点、过学习与欠学习、维数灾难、泛化能力差等[7,8]
缺陷,尤其对小样本数据进行预测时,其预测结果很难令人满意。
粒子群算法(PSO)是一种群体智能优化算法,目前被广泛应用于各种优化问题[9-11],特
别是与其它算法相结合,已成为预测领域中的研究热点,徐龙琴[12]等针对支持向量机(SVR)
参数以及核函数参数选取计算量大,时间复杂度高,不易获取适宜的参数组合的缺点,将其
基金项目:高等学校博士学科点专项科研基金博导类资助课题(20126118110015)
作者简介:高峰(1986—),男(汉族),博士研究生,主要研究方向:水环境模拟与污染控制研究
通信联系人:冯民权(1964—),男,教授,主要研究方向:水环境模拟与污染控制研究,. E-mail:
mqfeng@xaut.edu.cn
- 1 -
中国科技论文在线
http://www.paper.edu.cn
与粒子群算法相结合,建立了粒子群优化加权支持向量机水质预测模型,增强了 SVR 的适应
能力,同时改善了预测精度和稳定性;虞英杰[13]等针对 BP 神经网络模型在训练和测试中易
陷入局部最优的缺点,将其与粒子群算法结合,预测水体中叶绿素 a 浓度,增强了 BP 网络
45
的泛化能力,优化了全局收敛性,提高了预测精度。本研究在前人已有工作的基础上,首先
对水质监测数据进行归一化处理,应用灰色关联分析对样本数据进行维归约,确定 BP 网络
的输入节点,增强网络的适应能力;为了改善网络的全局收敛性,提高预测精度,本研究采
用粒子群算法对 BP 神经网络进行优化,以期得到更好的预测结果。
1 理论方法
50
1.1 粒子群算法优化 BP 神经网络预测模型的建立
粒子群算法优化 BP 神经网络分为 BP 网络结构确定、粒子群算法、BP 神经网络预测 3
个部分。粒子群算法优化 BP 神经网络的权值和阈值,粒子群算法的适应函数由神经网络训
练样本集的输出误差给出,个体通过适应度函数计算个体适应值[14],适应值越小表明微粒
在移动搜索过程中有更好的性能。网络权值的优化过程是一个反复迭代过程,通过不断改变
55
微粒在权值空间内的位置来得到输出层的最小误差,改变微粒速度以更新网路权值,减少均
方差误差(MSE)。在权值优化过程中,对每一次的优化都必须要对给定训练样本集进行分类,
保证每次训练时的样本集都不同,以提高神经网络的泛化能力。BP 神经网络用粒子群算法
得到最优个体对网络初始权值和阈值赋值,使优化后的 BP 神经网络经训练后能够更好的预
测函数输出。
60
1.2 PSO 优化 BP 神经网络算法流程
粒子群算法优化 BP 神经网络算法流程如图 1 所示。首先,将样本空间归一化,一部分
作为训练样本,另一部分作为预测样本。其次,适应度值由 BP 神经网络训练集输出误差给
出,确定 Gbest 和 Lbest,直至 Gbest 的误差小于预定误差△,输出最优值至 BP 网络部分。
最后,由给定的最优初始权值阈值进行 BP 神经网络预测。
- 2 -
中国科技论文在线
http://www.paper.edu.cn
确定输入
变量节点数
初 始 网 络 权
值阈值长度
获取最优
权值阈值
计算误差
B
P
网
络
部
分
阈值权值更新
Y
N
满足条件
Y
得到结果
产生初始
微粒群
向量映射,
组成网络
选择训练
样本集
计算其
适应值
P
S
O
算
法
F1<△
N
确定 Gbest
和 Lbest
粒群更新
65
70
图 1 PSO 优化 BP 神经网络算法流程图
Fig.1 Fow chart of PSO optimizing BP neural network
2 PSO 优化 BP 神经网络在汾河水质预测中的应用
汾河运城段自新绛南梁入境至万荣庙前汇入黄河,区段流长 109km。汾河运城段设有两
处监测断面,分别是新绛站里监测断面及河津大桥监测断面,主要监测上游来水以及汇入黄
河时的水质状况。据有关部门统计,2008 年河津断面监测结果:CODcr 超标 1.36 倍,BOD5
超标 2.89 倍,氨氮超标 13.75 倍,总磷超标 0.22 倍,近年来水质并没有改善很多,水体污
染严重,断流情况较重,河槽萎缩,大量依赖水生环境的生物失去生存环境,物种多样性降
低,河道生态退化。因此选此段河流进行水质预测对于该河段水质治理有重要意义。
75
2.1 研究数据
本研究样本集数据来源于汾河河津大桥监测断面 2005 年-2010 年枯水期月监测资料,
监测项目有:氨氮、挥发酚、水温、石油类、DO、BOD5 等地表水常规监测项目。
2.2 网络变量选择
该研究基于 PSO-BP 神经网络对汾河运城段水质预测,汾河运城段污染多为有机物污染,
80
COD 作为有机物相对含量的综合指标,对其进行分析,可了解汾河运城段水污染变化趋势。
所以把 COD 作为 BP 神经网络的输出变量。
输入变量的选取主要取决于已有的样本数据,但是不可能把所有的水质指标都作为输入
变量,这不但会增加预测模型的复杂度,造成算法在时间和空间上的浪费,而且得不到较好
- 3 -
中国科技论文在线
http://www.paper.edu.cn
的预测效果[13],因此我们只能选取和输出变量关联度较好的指标作为网络输入。对所有水
85
质指标进行灰色关联性分析[15],最终选择关联度较高的氨氮、挥发酚、水温、BOD5 以及
COD 为输入变量。监测数据如下表 1:
表 1 2005 年-2010 年枯水期河津大桥监测断面月平均水质监测数据
Table1 Monthly average water quality monitoring data at monitored section of Hejing
Bridge in drought period from 2005 to 2010
序号
监测时间
水温/°C
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
2005 年 1 月
2005 年 2 月
2005 年 3 月
2005 年 4 月
2005 年 12 月
2006 年 1 月
2006 年 2 月
2006 年 11 月
2006 年 12 月
2007 年 1 月
2007 年 2 月
2007 年 3 月
2007 年 4 月
2007 年 11 月
2007 年 12 月
2008 年 1 月
2008 年 2 月
2008 年 3 月
2008 年 4 月
2008 年 11 月
2008 年 12 月
2009 年 1 月
2009 年 2 月
2009 年 3 月
2009 年 4 月
2009 年 11 月
2009 年 12 月
2010 年 2 月
2
1
9
14
6.6
8
10.5
14.8
4.2
3
3
6
20
11
4.3
4
0.5
12.8
16
14
6
0.7
6
6.5
21
10
6
7.2
COD
115.75
122.51
150.73
118.92
162
141.12
165.22
106.93
165.67
188
148
116
191.48
82.22
136
145.02
97.54
109.07
128.37
88
108
97.6
84.9
111
118
31.2
82
94
污染因子浓度/(mg•L-1)
BOD5
32.2
32.2
38.2
28.2
37.2
35.2
41.2
23.2
32.2
42.2
38.2
30.2
53.2
21.3
22
49.2
49.2
43.5
45.2
31.2
39.2
33.2
35.2
41.4
47.2
13.2
17.5
21.5
氨氮
30.1
21.3
23.5
15
21.3
25.4
15.6
26.5
19.6
21
19.3
27.2
21.7
18.2
20.3
25.2
29.8
26.7
34.4
30.4
26.3
20.5
26.5
30
25.8
22.2
26.4
17.4
挥发酚
0.013
0.0194
0.0082
0.061
0.056
0.051
0.042
0.02
0.0376
0.0533
0.055
0.069
0.095
0.062
0.057
0.098
0.057
0.071
0.115
0.009
0.009
0.019
0.029
0.057
0.067
0.036
0.028
0.025
90
2.3 模型验证
利用已建立的 PSO-BP 网络预测模型对汾河运城段进行验证,选取 2005-2009 年的 24
个样本为训练样本集。构建 PSO-BP 神经网络模型,经过反复测试隐层节点数为 5 个,即包
含 5 个节点的输入层,代表氨氮、挥发酚、水温、BOD5 以及 COD;5 个节点的隐层;1 个节
点的输出层,代表 COD。对训练样本集进行训练,PSO 算法进化次数为 100 次,适应度值达
95
到 0.0014,使其收敛并有较高精度,进化过程如图 2。表现出对 BP 神经网络良好的训练效
果,得到一套适合汾河运城段 COD 预测的最优权值和阈值,其值由表 2 给出,COD 模拟值和
实测值比较如图 3,其相对误差如图 4 所示。由图 4 可看出该模型训练样本集的相对误差均
小于 5.5%,说明该模型的泛化能力较强。一般认为,水质模拟相对误差在 30%以内较好,因
此该模型模拟精度很好。
- 4 -
中国科技论文在线
http://www.paper.edu.cn
200
180
160
140
120
100
80
60
)
L
/
g
m
(
/
度
浓
D
O
C
预测值
实测值
0
5
15
10
样本序号
20
25
0.1
0.09
0.08
0.07
0.06
0.05
0.04
0.03
0.02
0.01
0
值
度
应
适
100
0 10 20 30 40 50 60 70 80 90 100
进化代数
图 2 适应度变化曲线 图 3 1-24 号样本 COD 模拟值和实测值比较
Fig.2 The curves of fitness Fig.3 Comparison of observed and measured
105
表 2 PSO 算法得到的最优权值和阈值
Table 2 the optimal initial weights and threshold values from PSO algorithm
of 1-24 samples
权值
输入 1
输入 2
输入 3
输入 4
输入 5
阈值
输出节点
权值
输出节点
)
%
(
/
差
误
对
相
阈值
6
5
4
3
2
1
0
-1
-2
-3
0
隐层节点 1
隐层节点 2
隐层节点 3
隐层节点 4
隐层节点 5
0.653402
1
0.096566
-0.26409
-0.19737
0.105558
0.105558
0.49509
-0.28697
-0.11429
0.435853
0.208985
0.040629
0.040629
-0.29874
-0.00582
-0.83718
-0.36722
0.099732
-0.24206
-0.24206
-0.08298
120
110
100
90
80
70
60
50
40
30
)
L
/
g
m
(
/
值
度
浓
D
O
C
25
5
10
15
样本序号
20
25
-0.08937
0.115018
-0.08076
-0.02173
0.032635
-0.33949
-0.33949
-0.47386
0.315859
-0.03101
-0.25185
0.340477
0.041483
0.041483
预测值
实测值
26
27
样本序号
28
图 4 1-24 号样本的相对误差 图 5 预测值与实测值比较
Fig.3 The relative error of 1-24 samples Fig.5 Comparison of predicted and measured
2.4 模型预测及分析
110
应用已训练好的 PSO-BP 神经网络模型进行预测,预测样本集为 2009 年 4 月、11 月、
12 月以及 2010 年 2 月 4 个独立样本。预测结果如表 3 所示。在同样的模型下,给出了以 BOD5、
氨氮、挥发酚等 3 个指标各自为输出变量时的预测结果,结果如表 4 所示。
- 5 -
中国科技论文在线
http://www.paper.edu.cn
表 3 给出了基于 PSO-BP 神经网络模型和传统 BP 神经网络模型汾河运城段的水质预测结
果及相对误差,可以看出基于 PSO-BP 神经网络模型的预测结果更加切合实际,虽然在样本
序号 25、28 处,相对误差高于传统 BP 神经网络模型[15],但是在这两处的误差差距不大,
是能够接受的。而在样本序号 26 处,相对误差从 15.43%改善到 1.46%,有大幅度降低。由
表 3 可得到 PSO-BP 模型的平均误差为 1.01%要低于传统 BP 神经网络模型的 4.00%,同时
PSO-BP 模型的预测均方根误差为
1.605
×
410
−
,而传统 BP 神经网络模型的预测均方根误差为
−
5.956
310
× ,预测均方根误差也有了很大改善。因此,基于 PSO-BP 神经网络模型的预测更
加精确。
115
120
表 3 COD 预测结果及误差分析
Table 3 predicted results of COD and error analysis
序号
监测时间
25
26
27
28
2009 年 4 月
2009 年 11 月
2009 年 12 月
2010 年 2 月
COD 实测值
/(mg·L-1)
118
31.2
82
94
PSO-BP 模型
传统 BP 模型
COD 预测值
/(mg·L-1)
117.5756
31.6555
81.8402
92.0902
相对误差/
(%)
0.36
1.46
0.19
2.03
COD 预测值
/(mg·L-1)
117.8896
36.0142
82.2074
93.7907
相对误差
(%)
0.0936
15.43
0.2529
0.2227
表 4 其它指标预测结果及误差分析
Table 4 predicted results of other indicators and error analysis
125
序号 监测时间
25
26
27
28
2009 年 4
月
2009 年 11
月
2009 年 12
月
2010 年 2
月
BOD5
实测值
/(mg·L-1)
47.2
PSO-BP 模型
COD 预
测值
/(mg·L-1)
48.5216
相对误差/
(%)
2.8
氨氮实
测值
/(mg·L-1)
PSO-BP 模型
氨氮预
测值
/(mg·L-1)
相对误
差(%)
挥发酚实
测值
/(mg·L-1)
PSO-BP 模型
挥发酚预
测值
/(mg·L-1)
相对误差
(%)
25.8
25.7510
0.19
0.067
0.0641
13.2
13.3148
0.87
22.2
21.3409
3.87
0.036
0.0355
17.5
17.7800
1.6
26.4
26.4422
0.16
0.028
0.0296
21.5
21.4162
0.39
17.4
16.9841
2.39
0.025
0.0248
4.28
1.39
5.55
0.76
由表 4 可知 BOD5、氨氮、挥发酚等 3 个指标的预测误差为:0.39~2.8%、0.16%~3.87%、
0.76~5.55%,最大相对误差出现在挥发酚序号 25 处为 5.55%。结果表明该模型在输入、输
出变量改变的情况,模拟的误差虽然较 COD 大,但是依然很精确,说明该模型有良好的泛化
能力和稳定性。
3 结论
130
本文充分利用 PSO 的全局搜索能力和 BP 神经网络的非线性拟合能力的特点,所建立的
水质预测模型在小样本预测中也能保持较高的预测精度,具有较强的泛化能力和实用性。
(1)根据汾河运城段实际监测数据,建立了 PSO-BP 神经网络模型,对 COD、BOD5、氨氮、
挥发酚等进行预测,预测结果表明该模型具有良好的泛化能力和稳定性;
135
(2)以 COD 为例,将预测结果与传统 BP 神经网络模型相比,结果显示:PSO-BP 模型使
最大相对误差从原来的 15.43%大幅度减少到 1.46%,其平均误差变化由原来的 4.00%改善到
1.01%,均方根误差由
1.605
×
410
−
改善到
5.956
×
310
−
。表明,基于 PSO-BP 神经网络模型比
传统 BP 神经网络模型有更好的预测精度;
- 6 -
中国科技论文在线
http://www.paper.edu.cn
(3)本文构建的 PSO-BP 神经网络模型可应用于其他河流的水质预测。动态 PSO 算法与其
他神经网络的结合在动态变化的反馈预测方面有更大的潜力,应是今后研究的重点。
[参考文献] (References)
[1] OH H M,AHN C Y,LEE J W,al.Community patterning and identification of predominant factors in algalbloom
in Daechung Reservoir(Korea) using artificial neural networks[J].Ecol Model,2007,203:109-118.
[2] ZHANG Zhi(张志). Study on Artificial Neural Network Model for Water Quality Prediction [J]. Acta
Scientiarum Naturalium Universitatis NeiMongol (内蒙古大学学报(自然科学版)),2006,37(6):703-707.
[3] YUAN Honglin(袁宏林),GONG Ling(龚令). Forecasting the water quality index in Zaohe river based on BP
neural network model [J]. Journal of Safety and Environment (安全与环境学报),2013,4(2):106-110.
[4] GUO Liang(郭亮),WANG Peng(王 鹏), et al. Water quality forecast through application of BP neural network
at Sifangtai [J]. Journal of Harbin Institute of Technology (哈尔滨工业大学学报),2009,41(6):62-66.
[5] LIU Dongjun(刘东君),ZOU Zhihong(邹志红). Application of weighed combination model on forecasting
water quality[J].Acta Scientiae Circumstantiae(环境科学学报).2012,32(12):3128-3132.
[6] WU Chengxuan(吴承璇),ZHANG Yingying(张颖颖), et al.Water Quality Parameter Prediction using Neural
Network Based on time Series[J].Water Resources and Power(水电能源科学).2013,31(2):47-49.
[7] ZHAO Shixin(赵世新),ZHANG Chen(张晨),et al. Predicted water-quality evaluation of Lihe sector in Luanhe
diversion to Tianjin water project based on BP neural network [J]. Journal of Safety and Environment (安全与环
境学报),2010,10(2):63-96.
[8] BAI Ji-zhong, YANG Jian-ming, FENG Min-quan. Study on the water environmental capacity and the sewage
control of the Sushui River[C]. MSIT2011, 2011, 9: 995-1001.
[9] GAO Shang(高尚),YANG Jingyu(杨静宇).Research on Chaos Particle Swarm Optimization Algorithm[J].
Pattern Recognition and Artificial (模式识别与人工智能)[J].2006,19(2):266-270.
[10] WANG Wenjuan(王文娟),CAO Junxing(曹俊兴), et al. Reservoir Parameter rediction of Neural network
based on Particle swarm Optimization [J]. Journal of Southwest Petroleum University ( 西 南 石 油 大 学
报),2007,29(6):31-34.
[11] LI Zuiyong(李祚泳),WANG Jiayang(汪嘉杨),GUO Chun(郭淳). A New Method of BP Network Optimized
Based on Particle Swarm Optimization and Simulation Test [J]. Acta Electronica Sinica ( 电 子 学
报)2008,36(11):2224-2228.
[12] XU Longqin(徐龙琴),LIU Shuangyin(刘双印).Study of Short term Water Quality Prediction Model Based on
PSO-WSVR[J]Journal of Zhengzhou University(Engineering Science)( 郑 州 大 学 学 报 ( 工 学
版)).2013,34(3):112-116.
[13] YU Yingjie(虞英杰),JIANG Weigang(蒋卫刚) ,et al.Prediction of Chlorophyll a by BP Neural Network
based on PSO Algorithm[J].Research of Environmental Sciences(环境科学研究).2011,24(5):526-532.
[14] WANG Ping(王平),WANG Caiyun(王彩芸), et al. Application of BP ANN optimized by hybrid algorithm
based on PSO in wear volume prediction of rail steel[J].Journal of Machine Design (机械设计): 2013,30(8):15-20.
[15] FENG Minquan(冯民权) ,et al.Water quality prediction using BP network and Markov model:based on grey
incidence analysis[J].Journal of natural disasters(自然灾害学报).2011,10(5):169-175.
140
145
150
155
160
165
170
175
- 7 -