logo资料库

matlab在水质监测中的应用-基于MATLAB图形用户接口的水质综合评价神经网络模型.pdf

第1页 / 共6页
第2页 / 共6页
第3页 / 共6页
第4页 / 共6页
第5页 / 共6页
第6页 / 共6页
资料共6页,全文预览结束
·806· 中国环境保护优秀论文集(2005) 基于 MATLAB 图形用户接口的水质综合评价神经网络模型 黄 嵘 (上海市环境监测中心) 摘 要 以溶解氧、高锰酸盐指数、生化需氧量、氨氮和化学需氧量作为评价因子,经反复尝试,在 MATLAB 图形用户接口环境下,建立了三层 BP 神经网络评价模型,通过对黄浦江水质监测结果的实 例检验,证明神经网络评价方法在水质综合评价上是客观的和合理的。 关键词 MATLAB 神经网络 水质评价 一、引 言 水质综合评价是环境保护工作中一项十分重要的内容,它的主要任务是根据环境监测部门给 定的水质指标监测值来为水域环境功能的规划和保护提供科学的依据。目前,在我国的环境状况 公报中,对水质考评是依据2002年国家重新修订颁布的《地表水环境质量标准》,采用的是单指 数评价法(又称极值法),以其中最差的指标来评价。单指数评价方法运用于水环境影响评价有 利于水环境的保护,但如果运用于水环境质量评价,就会大大降低水域功能,不能发挥水环境的 综合作用。近年来发展起来的人工神经网络技术为实现上述目标提供了有效的方法。人工神经网 络是以历史的实测数据为基础,以学习的方式找出事物的因果规律,摒弃了以分析反应机理和以 往确定的数学表达式为基础的建模方法[1、2]。理论上已经证明:三层以上的人工神经网络能够准 确的完成任意非正交集合的分类[3]。本文研究的目的就是试图建立一个能客观评价水质环境综合 状况的人工神经网络模型。 二、指标的确定 (一)特征水体的选择 黄浦江是上海地区的主要河流,是上海一千多万人口的饮用水源。目前上海市政府已启动黄 浦江两岸综合开发计划,举世瞩目的2010年世博会的展览会址也选定在黄浦江沿岸地区, 因此 黄浦江的水质优劣受到普遍关注,科学监测、评价和保护黄浦江的水质具有重要意义。本文选取 黄浦江作为主要研究对象,利用BP网络,为其构建指标评价体系。此外,由于目前黄浦江上游至 下游水质状况变化跨度较大(从Ⅱ类至Ⅴ类),也利于分级评价。 (二)评价指标的筛选 黄浦江生态系统目前的主要压力来自环境变化,导致生态系统结构和功能发生变化。依据我 国地面水环境质量标准(GB3838—2002),在水质综合评价及现有资料的基础上,考虑到目前黄 浦江水体主要污染特征——有机污染,选取了化学需氧量(CODCr)、高锰酸盐指数(CODMn)、 五日生化需氧量(BOD5)作为主要评价指标之一。此外由于有机污染对水生生态系统的危害主 要取决于其对水体溶解氧(DO)的消耗,因此在该指标体系中加入溶解氧指标。氨氮(NH3-N) 是上海地区水体中的又一主要污染物,黄浦江大部分断面氨氮超标严重(达Ⅲ类至Ⅴ类水),其 一方面影响水体中的溶解氧浓度,另一方面高浓度氨氮又会对水生生物产生毒性伤害,因此也是 本指标体系的主要指标之一。
第四章 环境监督管理制度建设与探讨 ·807· 最终确定了溶解氧(DO)、高锰酸盐指数(CODMn)、生化需氧量(BOD5)、氨氮(NH3-N)、化 学需氧量(COD)五个核心指标作为基本评价因子。 表 1 地表水环境质量标准(单位:mg/L) Ⅱ类 Ⅲ类 Ⅳ类 Ⅴ类 2 15 10 2.0 40 标准 级别 Ⅲ Ⅴ Ⅴ Ⅴ Ⅲ Ⅴ Ⅴ Ⅴ Ⅲ Ⅳ Ⅴ Ⅴ Ⅲ Ⅳ Ⅴ Ⅴ Ⅱ Ⅳ Ⅴ Ⅴ Ⅲ Ⅳ Ⅴ Ⅴ 溶解氧 高锰酸盐指数 生化需氧量 氨氮 化学需氧量 ≥ ≤ ≤ ≤ ≤ Ⅰ类 7.5 2 3 0.15 15 6 4 3 0.5 15 5 6 4 1.0 20 3 10 6 1.5 30 表 2 黄浦江水质监测结果 高锰酸盐指数 生化需氧量 氨氮 化学需氧量 (CODMn) (BOD5) (NH3-N) 5.34 5.91 6.31 4.62 4.31 6.45 6.88 4.68 4.6 5.36 5.7 5.86 4.13 5.76 6.63 4.89 3.92 5.95 4 4.11 4.03 4.76 5.31 3.37 1.88 1.46 5.34 6.77 1.87 1.38 9.52 3.91 1.49 2.3 4.83 4.26 1.45 1.31 8.74 2.89 1 2.1 4.7 1.42 1 2.08 8.02 2.11 0.59 1.8 3.35 2.07 0.62 1.78 4.76 3.52 0.35 1.16 2.46 2.45 0.22 0.57 2.23 2.17 0.35 0.5 1.76 1.79 0.5 1.05 2.56 1.66 (COD) 17.38 21.01 38.75 20.37 15.04 14.11 56.76 21.8 14.53 16.77 39.82 17.45 11.72 18.64 25.5 16.81 11.02 19.44 20.5 13.57 10.35 25.24 51 10.67 溶解氧 (DO) 11.82 9.49 3.54 9.02 10.75 7.64 2.51 6.65 5.83 4.5 1.81 1.79 7.05 3.87 1.1 2 7.17 4.38 2.07 2.92 9.19 5.58 2.82 4.86 时间 点位 淀峰 松浦 杨浦 吴淞 淀峰 松浦 杨浦 吴淞 淀峰 松浦 杨浦 吴淞 淀峰 松浦 杨浦 吴淞 淀峰 松浦 杨浦 吴淞 淀峰 松浦 杨浦 吴淞 月 月 月 月 月 月
·808· 中国环境保护优秀论文集(2005) 三、网络的构建 BP神经网络(Back Propagation Network)通常是指基于误差反向传播算法(BP算法)的多 层前向神经网络,据统计有近90%的神经网络应用是基于BP算法的[4]。理论上已经证明:三层以 上的BP网络可以以任意精度逼近任何一个具有有限间断点的非线性函数。 (一)BP 网络结构及 BP 算法的数学描述 一个三层的网络结构如图1所示。它由输入层,隐含层和输出层三层组成。对于多于三层的多 层神经网络,则包含更多的隐含层。每层都由若干个神经 元(节点)组成。每个神经元均由输入、输出,输入和输 出之间的关系可用传递函数来描述,通常是Sigmoid型可微 函数,所以可以实现输入和输出间的任意非线性映射。 BP学习算法由正向传播和反向传播组成[5]。正向传播 中,输入信号从输入层经隐层传向输出层。若输出层得到 了期望的输出,学习算法结束。反向传播是将误差信号(样 本输出与网络输出之差)按原连接通路反向计算,由梯度 下降法调整各层神经元的权值和阈值,使误差信号减小。 (二)综合评价的期望值选择 模型以实测水质指标作为输入层神经元,输出层用5 个神经元表示5种水质级别,评价时选输出值最大者所在的 输出作为综合类别。若样本的综合评价结果为j级,则样本 标准输出值 Dk { 0 . 9 = 0 . 1 k k ≠ ≠ j j k=1,2,…,6 在此将Dk的值取为0.9和0.1,是因为考虑到Sigmoid函 图 1 神经网络结构 数在0、1附近的梯度很小,若采用过去常用的神经网络标准输出值0和1,则在实际输出值项标准 输出值逼近的最后过程中,必将进入一个漫长的平坦区,不利于计算的迅速收敛[6]。表3列出了 BP网络模型对输入样本的输出期望值。 表 3 BP 网络模型的输出期望值列表 标准级别 Ⅰ Ⅱ Ⅲ Ⅳ Ⅴ 输出期望值 0.9,0.1,0.1,0.1,0.1 0.1,0.9,0.1,0.1,0.1 0.1,0.1,0.9,0.1,0.1 0.1,0.1,0.1,0.9,0.1 0.1,0.1,0.1,0.1,0.9 (三)基于 MATLAB 的图形用户接口(GUI)的神经网络设计 1.网络的训练 图形用户界面GUI(Graphical User Interfaces)是MATLAB 6.x神经网络工具箱的新增功能。 借助于GUI,用户可以比直接利用工具箱函数更快捷和方便的完成神经网络的设计与分析[4] 。 将1月、3月、5月、7月和9月黄浦江水环境水质核心指标监测结果作为训练输入,得到一个
第四章 环境监督管理制度建设与探讨 ·809· 20组五元素的输入向量P;而将1999年1月、3月、5月、7月和9月黄浦江水环境水质核心指标监测 结果的输出期望值作为训练输出,得到一个20组五元素的输出向量T。 依次将模型的训练函数设为TRAINBR、学习函数为LEARNGDM、性能函数为MSE(均方误 差函数)、网络激活层层数为2,隐层的神经元数目11,传递函数为TANSIG(正切S型函数)输出 层的神经元数目为5,传递函数为LOGSIG(对数S型函数)。 在经过反复调试,在表4中列出了网络各项训练参数的优化设置。 项目 epochs goal Max-fail Mem-reduc Min-grad mu Mu-dec Mu-inc Mu-max show time 表 4 网络各项训练参数的设置 功能 训练步数 网络性能目标 最大验证失败次数 参数 10000(缺省值为 100) 0.01(缺省值为 0) 5(缺省值为 5) 权衡计算雅可比矩阵时占用的内存空间和计算速度 1(缺省值为 1) 性能函数的最小梯度 Marquardt 调整参数 mu 的下降因子 mu 的上升因子 mu 的最大值 两次显示之间的训练次数 最长训练时间(以秒计) 0.001(缺省值为 1e-10) 0.005(缺省值为 0.005) 0.1(缺省值为 0. 1) 10(缺省值为 10) 1e+10(缺省值为 1e+10) 10(缺省值为 25) Inf(缺省值为 Inf) 至此,已经在图形用户接口中建立起了需要的网络。 图2显示出了网络的训练过程。网络在5319个时间步长里完成了训练,实现了误差小于0.001 的目标。 2.网络的仿真 将1999年11月黄浦江水环境水质核心指标监测结果作为仿真输入,得到一个4组五元素的输 入向量Pn,导入网络进行仿真。 图 2 网络的训练过程
·810· 中国环境保护优秀论文集(2005) 表5列出了BP网络模型的仿真结果。可以看出,除淀峰外,两种输出值对地表水环境水质评 价结果是完全相同的。从淀峰的监测资料看,该点位除高锰酸盐指数(CODMn)略超Ⅱ级,属Ⅲ级 外,其余指标均优于Ⅲ级,BP网络模型认为其属于Ⅱ级水质类别是完全合理的(见图3)。应用结 果表明:BP网络模型已建立了地表水环境质量评价指标与评价级别之间的复杂对应关系,具备了 对地表水环境质量做出客观评价的能力。 表 5 BP 网络模型的仿真结果 点位 标准输出值 仿真输出值 淀峰 0.1 0.1 0.9 0.1 0.1 0.11109 0.97753 0.021775 0.11486 0.12315 松浦 0.1 0.1 0.1 0.9 0.1 0.10017 0.10322 0.075439 0.92145 0.090387 杨浦 0.1 0.1 0.1 0.1 0.9 0.099249 0.098226 0.096296 0.10839 0.89627 吴淞 0.1 0.1 0.1 0.1 0.9 0.10379 0.10012 0.099913 0.098004 0.91025 图3 黄浦江水质的BP网络评价结果 四、结语 1.BP神经网络由于具有很强的自学能力、自组织和自适应能力,网络模型的大量参数均由 学习所得,而不是人为给定,这是该方法与传统方法的最根本区别,因而,BP网络模型评价结果 更客观、更合理。 2.用MATLAB软件实现了输入输出的向量化,因而使得模型结构大大简化。利用图形用户 接口,极大的简化了编程工作,可以集中精力在网络参数的调整上,提高系统性能。 3.该神经网络用trainbr函数(贝叶斯正则化方法)对网络训练,用learngdm函数进行网络学习, 依据Levenberg-Marquardt优化理论,采用动量梯度下降方法对网络的权值和阈值进行调整,提高 了学习速度,降低了网络对于误差曲面局部细节的敏感性,有效抑制网络陷于局部极小,避免了 “过度训练”情况的出现,提高了网络的推广能力。 4.对于三层(输入层,隐层,输出层)BP网络,只要其隐层的神经元数可选,就可以任意 精度逼近任何连续函数(Kolmogorov定理)。但隐层神经元数的选择是一个复杂的问题,至今还 没有得出一个很好的解析式用来计算出合适的隐节点数。一般而言,增加隐层神经元数可以改善 网络与训练样本匹配的精度,但过多的隐层节点又会增加陷入局部极小的机会。 5.在这里选用分级评价方法对样本进行综合评价,确定样本的标准输出值,并不意味着这
第四章 环境监督管理制度建设与探讨 ·811· 种方法是最精确的评价法,也不是说样本输出值仅由这一种方法确定。事实上,若发现某些样本 用这种方法得出的评价结果不准确,还可根据专家意见或采用其他合适的方法进行修正。这样就 得到了一套能用于神经网络训练的有很好代表性和较高准确性的样本。 6.目前,通过MATLAB图形用户接口构建的BP网络还处于原型阶段。实际上,没有一个固 定的方法或模型适用于一切情况,,并保证由于其他一切方法或模型。因此,对于应用中的各种 实际问题,应具体情况具体分析,在今后的实际应用中进一步拓展和提高其适用性和准确性。 综上所述,通过基于MATLAB图形用户接口的地表水环境质量的BP网络评价系统的研究,可 以获得一些有益的启示,这对将来进一步改善地表水环境质量综合评价方法起到一个抛砖引玉的 作用。 参考文献 [1] 胡守仁.神经网络导论.长沙:国防科技大学出版社,1993 [2] 张继萍,吴硕贤.人工神经网络在道路交通噪声预测中的应用.环境科学学报,1998;18(5):471~477 [3] 胡守仁.神经网络应用技术.长沙:国防科技大学出版社,1993 [4] 许东,吴铮.基于 MATLAB6x的系统分析与设计——神经网络. 第二版,西安:西安电子科技大学出版 社,2002 [5] 徐丽娜.神经网络控制.北京:电子工业出版社,2003 [6] 刘首文,冯尚友.人工神经网络在湖泊富营养化评价中的应用研究.上海环境科学,1996;15(1):11~14.
分享到:
收藏