logo资料库

论文研究-基于动态粒度小波神经网络的空气质量预测.pdf

第1页 / 共4页
第2页 / 共4页
第3页 / 共4页
第4页 / 共4页
资料共4页,全文预览结束
Computer Engineering and Applications 计算机工程与应用 2013,49(6) 221 基于动态粒度小波神经网络的空气质量预测 汪小寒 1,张燕平 2,赵 姝 2,张 铃 2 WANG Xiaohan1, ZHANG Yanping2, ZHAO Shu2, ZHANG Ling2 1.安徽师范大学 数学计算机科学学院,安徽 芜湖 241003 2.安徽大学 计算科学与技术学院,合肥 230039 1.School of Mathematics and Computer Science, Anhui Normal University, Wuhu, Anhui 241003, China 2.School of Computer Science and Technology, Anhui University, Hefei 230039, China WANG Xiaohan, ZHANG Yanping, ZHAO Shu, et al. Air quality forecasting based on dynamic granular wavelet neural network. Computer Engineering and Applications, 2013, 49(6):221-224. Abstract:A new method of air quality forecasting based on dynamic granular wavelet neural network is put forward by the combination of quotient space theory, wavelets theory and neural network theory. Different granula can be obtained by the granu- lating of original data domain using quotient space theory and the best one can be found by testing it in the practice. The best guanula is used as the input to wavelet neural network for air quality forecasting. By this means, the forecast accuracy can be improved after the problem solving space has been changed. Experimental result of air quality forecasting also shows that this method is more effective. Key words:quotient space; dynamic granula; wavelet neural network; air quality; forecasting 摘 要:针对空气质量预测,提出了基于动态粒度小波神经网络的预测方法。为了选取合适的粒度,结合实际问题采用不断 尝试的方法动态选取最优粒度,在最优粒度空间中求解问题。粒度变换后可以改变空气质量预测问题的求解空间,提高预 测的精确度。实验也验证了动态选取的最优粒度作为小波神经网络的输入进行空气质量预测,可以取得更好的预测准确率。 关键词:商空间;动态粒度;小波神经网络;空气质量;预测 文献标志码:A 中图分类号:TP391 doi:10.3778/j.issn.1002-8331.1210-0277 1 引言 城市空气污染问题是一个严重的环境问题。控制空气 污染、提高空气质量日益成为世界各国环境综合治理的目 标。作为城市空气污染治理的重要工作之一,城市空气污染 预测有利于建立城市污染预报体系,有效降低空气污染治 理成本,为管理部门的空气环境治理决策提供科学依据[1]。 因此,寻求空气污染物预测有效方法具有十分重要的现实意 义。国内外对大气污染预测主要采用回归分析、时间序列、 灰色系统等预测方法。但预测的准确率并不令人满意 [2]。 这是由于大气污染物浓度的变化受到多种因素的影响而呈 现较强的非线性特性,空气中污染物浓度的预测亦是一个 复杂的非线性问题,很难用确定的数学模型描述[3]。 国内外的研究表明神经网络能够比回归模型更好地 预报空气污染物[4]。小波神经网络是小波分析理论与神经 网络理论相结合的产物。它综合了小波变换特有的时频 局部特性和变焦特性及神经网络自学习、自适应、鲁棒性、 容错性和推广能力等优点。它在解决非线性问题中的优 异表现,使其适于神经网络应用的所有领域,并得到了广 泛的应用[5]。但现有的基于小波神经网络空气质量预测模 型很少有粒度 [6-7]的变换和选取,这与人类从不同层面、不 同大小粒度上分析思考复杂问题的思维方式不完全相符, 因此可以从粒度的角度对原有小波神经网络模型进行改 进。本文提出了一种基于动态粒度的小波神经网络模型, 利用商空间理论 [8-10]进行粒度变换,寻找合适粒度,并在该 粒度空间中用小波神经网络对结果进行预测,实验结果证 实这种方法对于空气质量预测具有较好的应用性。 2 基于动态粒度小波神经网络的空气质量预测 2.1 模型描述 文献[8]指出:人类智能的一个公认特点,就是人们能 基金项目:国家自然科学基金(No.61175046,No.61073117);安徽高校省级自然科学研究项目(No.KJ2012Z121);安徽师范大学人才培育 基金项目(No.2010rcpy037)。 作者简介:汪小寒(1978—),女,讲师,主要研究方向:智能计算及其应用;张燕平(1962—),女,博士,教授;赵姝(1979—),女,博士,副教授; 张铃(1937—),男,教授。E-mail:hanxiaoahnu@sina.com 收稿日期:2012-10-26 修回日期:2012-12-17 文章编号:1002-8331(2013)06-0221-04
222 2013,49(6) Computer Engineering and Applications 计算机工程与应用 从极不相同的粒度上观察和分析同一问题。人们不仅能 在不同粒度的世界上进行问题求解,而且能够很快地从一 个粒度世界跳到另一个粒度世界,往返自如,毫无困难。 这种处理不同粒度世界的能力,正是人类问题求解的强有 力表现。文献[9]指出:粒度的选择与划分,与问题所属领 域的具体知识密切相关,因此在实际问题求解中,粒度的 划分有时是动态的。人们看问题总是从不同角度不同层 面上分析,然后得出结论。事实上,在具体应用中,粒度过 粗过细均不能很好地解决问题,需要结合具体问题选取合 适的粒度,即对粒度进行动态选择。本文利用商空间理论 的属性函数划分法选取粒度,将所选的粒度作为小波神经 网络的输入进行学习和测试,通过在实践中不断尝试,动 态确定出“最优”粒度,并在该粒度空间中分析问题,从而 能够更好地解决问题。本文方法模型如图 1 所示。 非最优粒度 原始 数据 粒度 小波神 经网络 分析 判断 最优粒度 最终预 测结果 图 1 动态粒度小波神经网络的空气质量预测模型 2.2 粒度的动态选取 文献[8]指出:商空间理论的核心就是将问题放在各种 不同粒度的空间上进行分析研究,粒度的选取主要是通过 “颗粒化”来实现。本文的颗粒化问题主要是对属性 f 取不 同的粒度,通过属性函数法对论域划分,达到颗粒化的目的。 设 f:X ® Y 是属性函数,若 f 是单值的,则可利用 f 来定 义划分。一般来说,对 Y 的结构比较清楚,如 Y 是实数集或 Rn 欧式空间,可以利用 Y 的分类来定义 X 中对应的分类。 方法为:设 {Yi} 是 Y 的一个划分,定义 Xi ={x|f (x)Î Yi} ,则 {Xi} 是 X 的一个划分。 例如现在用一个三元组 (X f T ) 描述空气质量问题, 其中 X 是论域,f 是论域的属性,T 是论域的结构。若从日平 均气压、日平均气温、日平均相对湿度、日平均总云量、日 平均低云量、日降水量、前一天降水量、日平均风速、前一 天 PM10、当日 PM10 共 10 个属性来考察天气质量状况,那 么 f = ( f1 f2 f3 f4 f5 f6 f7 f8 f9 f10) 。 用 某 个 时 间 属 性函数(例如 5 天的时间属性)对论域进行划分以后就获得 新的粒度空间 ([X ][ f ][T ]) 。 2.3 小波神经网络预测 小波神经网络 [11]是一种以 BP 神经网络拓扑结构为基 础,把小波基函数作为隐含层节点的传递函数,信号前向 传播的同时误差反向传播的神经网络。实验中采用的小 波神经网络 [11]为 3 层网络:输入层、隐含层和输出层。设  X 为 X 1  Y 为输入层,Y 1 为输出层,w  X 2  Y 2 、w jk m ij k 神经网络的权值。 隐含层第 j 个节点输出值为: h( j) = h k é å ê ê êê i = 1 ë j ω x i ij - b a j j ù ú ú úú û ( j = 1 2 l) (1) 公式(1)中 h j 为小波基函数,b 为 h j j 的平移因子。小 波基函数为 Morlet 母小波基函数,数学公式为: ) 1.75x e-x2/2 y = cos( 小波神经网络的输出层计算公式为: y(k) = å (k = 1,2,,m) h(i) ω l ik i = 1 (2) (3) 小波神经网络的权值参数修正采用梯度修正法修正 网络的权值和小波基函数参数[11],网络预测误差公式为: m e = å k = 1 ym(k) - y(k) (4) = ηωi + Dω(i + 1) n k 根据预测误差 e 修正小波神经网络权值和小波基系数。 ω(i + 1) (5) n k a(i + 1) k b(i + 1) k Dω(i + 1) n k = ai k = bi k (6) (7) (8) k (9) (10) k n k + Da(i + 1) + Db(i + 1) = -η ¶e ¶ωi = -η ¶e ¶αi = -η ¶e ¶bi n k n k n k Da(i + 1) n k Db(i + 1) n k 小波神经网络算法步骤[11]如下: 步骤 1 网络初始化。主要是对小波函数的伸缩因子 、网络学习速率设 、网络连接权重 ω 、平移因子 b 、ω k ij jk a k 置 η 。 步骤 2 样本分类。把样本分为训练样本和测试样本, 训练样本用于训练网络,测试样本用于测试网络预测精度。 步骤 3 预测输出。把训练样本输入网络,计算网络输 出和期望输出的误差 e。 步骤 4 权值修正。 步骤 5 判断算法是否结束,若未结束,转向步骤 3。 基于动态粒度小波神经网络的空气质量预测步骤为: 步骤 1 以商空间理论为基础,用时间属性函数论域划 分方法对论域进行划分,获得某种粒度和商空间。 步骤 2 在该粒度商空间下,用小波神经网络进行样本 的学习和预测。 步骤 3 重复步骤 1,步骤 2,在实验中动态确定大小最 合适的粒度,使预测效果最佳。 步骤 4 在所确定的最优粒度空间中,对样本进行分析 和预测。 3 基于动态粒度小波神经网络的空气质量预测 实验 3.1 实验数据介绍 实验数据源于宣城市气象局和宣城市环境监测保护 中心,仿真实验通过 Matlab 工具软件模拟执行。实验数据 选取了宣城市 2003 年、2004 年、2005 年的气候因子和 PM10 值进行分析,选取的具体数据项为:日平均气压、日平均气 温、日平均相对湿度、日平均总云量、日平均低云量、日降
汪小寒,张燕平,赵 姝,等:基于动态粒度小波神经网络的空气质量预测 2013,49(6) 223 水量、前一天降水量、日平均风速、前一天 PM10、当日 PM10, 共 10 个属性值组成一个样本。原始样本数据按照连续的 日期顺序排列。实验中,根据我国城市空气质量日报 API 分级标准,将样本按照其 PM10 值的大小分成 3 类:PM10 小 于 0.05 的为第 1 类,PM10 值大于等于 0.050 且小于 0.150 的 为第 2 类,PM10 大于 0.150 的为第 3 类。本文用于空气质 量预测的小波神经网络分为输入层、隐含层和输出层 3 层, 输入层有 10 个节点,分别为 10 个气象属性值,输出层 1 个 节点,为预测的 PM10 值。 通过属性函数划分法对原始样本数据取均值,获得 6 种不同大小的粒度如下: 粒度 1:由原始样本构成。2003 年样本 365 个,2004 年 样本 366 个。 粒度 2:用时间属性 2 天对原始数据划分,2003 年样本 179 个,2004 年样本 179 个。 粒度 3:用时间属性 3 天对原始数据划分,2003 年样本 119 个,2004 年样本 119 个。 粒度 4:用时间属性 5 天对原始数据划分,2003 年样本 79 个,2004 年样本 79 个。 粒度 5:用时间属性 10 天对原始数据划分,2003 年样 本 35 个,2004 年样本 35 个。 粒度 6:用时间属性 15 天对原始数据划分,2003 年样 本 24 个,2004 年样本 24 个。 3.2 实验结果 实验 1 用 2003 年的样本数据作为学习样本,2004 年 的样本作为测试样本,实验 1 结果如表 1 和图 2 所示。 表 1 实验 1 实验结果表 学习样 本个数 测试样 本个数 预测正 确个数 365 179 119 71 35 24 366 119 119 71 35 24 314 90 86 69 21 17 粒度 名称 粒度 1 粒度 2 粒度 3 粒度 4 粒度 5 粒度 6 正确率 /(%) 85.79 75.98 72.27 97.18 60.00 70.83 实验 2 用 2003 年的前 30 个样本作为学习样本,2004 年的前 30 个样本作为测试样本。 ) % /( 率 确 正 类 分 100 90 80 70 60 50 40 30 20 10 0 粒度 1 粒度 2 粒度 3 粒度 4 粒度 5 粒度 6 粒度名称 图 2 实验 1 在不同粒度下对 2004 年 数据分类准确率的对比图 实验 3 用 2004 年的数据作为学习样本,2005 年的数 据作为测试样本。 实验 4 用 2003 年,2004 年两年的数据作为学习样本, 2005 年的数据作为测试样本。 实验 2~实验 4 结果如表 2 和图 3 所示。 表 2 粒度 4 实验结果表 实验 名称 实验 2 实验 3 实验 4 粒度 名称 粒度 4 粒度 4 粒度 4 学习样 本个数 测试样 本个数 正确 个数 30 71 71 30 71 71 30 69 69 正确率 /(%) 100.00 97.18 97.18 3.3 实验结果分析 实验 1 选取了 2003 年数据,对 2004 年进行预测,共选 取了 6 种大小不同的粒度,表 1 是实验 1 中 6 种不同大小的 粒度进行预测的正确率的对比,由表 1 可以看出,粒度大小 的选取会较大影响预测的准确率。由表 1 可知:粒度 4 预 测正确率为 97.18%,是 6 种粒度中正确率最高的。因此,认 为粒度 4 为最合适粒度,通过动态选择,确定粒度 4 为问题 求解的最优粒度。 实验 2~实验 4 是在粒度 4 下进行的,是在最优粒度下, 取不同数量、不同年份数据的实验。这 3 个实验均是为了进 一步检验最优粒度下的预测分类效果。实验 2 是对 2004 年 的部分样本预测,用的数据是 2003 年的部分数据。实验 3、 实验 4 均是对 2005 年样本预测,实验 3 用的是 2004 一年的 数据作为学习样本,实验 4 用的是 2003 年和 2004 年两年的 数据作为学习样本。 2.0 1.9 1.8 1.7 1.6 1.5 1.4 1.3 1.2 1.1 1.0 号 别 类 预测空气质量类别值 实际空气质量类别值 0 5 10 15 20 25 30 样本编号 (a)实验 2 分类结果图 3.0 2.8 2.6 2.4 2.2 2.0 1.8 1.6 1.4 1.2 1.0 号 别 类 预测空气质量类别值 实际空气质量类别值 0 10 20 40 30 50 样本编号 60 70 80 3.0 2.8 2.6 2.4 2.2 2.0 1.8 1.6 1.4 1.2 1.0 号 别 类 预测空气质量类别值 实际空气质量类别值 0 10 20 40 50 30 样本编号 60 70 80 (b)实验 3 分类结果图 (c)实验 4 分类结果图 图 3 粒度 4 实验预测结果对照图
224 2013,49(6) Computer Engineering and Applications 计算机工程与应用 表 2 是实验 2~实验 4 的实验测试结果的对比表,图 3 是 仿真实验结果图。由表 2 和图 3 可以看出,在最优粒度 4 下 进行的实验 2~实验 4 的预测准确率分别是 100%、97.18%、 97.18%,预测准确率有明显提高。表 2 的实验结果表明,在 动态确定的最优粒度下,对 2005 年的样本预测也同样能取 得更好的结果,预测准确率更高。 因此,在对复杂问题求解时,需要选择合适大小的粒 度,本文通过在实践中不断尝试,动态选出最优粒度,能更 好地解决问题,获得更高的准确率。这种方法还可以推广 到高维海量数据以及其他领域数据分析和预测中。 4 结束语 本文提出了动态粒度小波神经网络的空气质量预测 方法,利用商空间问题求解理论的属性函数划分方法,将 原问题论域颗粒化,获得新的问题求解空间,并通过在实 践中不断尝试,动态划分并确定最合适的粒度,将该粒度 作为小波神经网络的输入,可以提高预测的准确率。进一 步研究将用其他的算法替代本文中的小波神经网络方法。 参考文献: [1] 李金娟,龚地萍,刘兴荣.基于 GM(1,1)模型的甘肃省武威市 空气污染物浓度的预测及分析[J].环境科学与管理,2012,37 (1):65-71. [2] 陈柳,马广大.大气中 SO2 浓度的小波分析及神经网络预测[J]. 环境科学学报,2006,26(9):1553-1558. [3] 郭庆春,何振芳,李力.西安市空气污染指数的神经网络预测 模型[J].河南科学,2011,29(7):863-868. [4] 赵宏,刘爱霞,王恺,等.环境空气 SO2 和 NO2 浓度的 GA_ANN 预测模型研究[J].计算机工程与应用,2010,46(8):199-201. [5] 唐雪琴,王侃,徐宗昌,等.基于 MAPSO 算法的小波神经网络 训练方法研究[J].系统仿真学报,2012,24(3):608-612. [6] Yao Y Y.A partition model of granular computing[J].LNCS Transactions on Rough Sets,2004,1:232-253. [7] Yao Y Y.Granular computing for data mining[C]//Proceedings of 2006 IEEE International Conference on Granular Com- puting.Kissimmee,FL,USA:IEEE Press,2006,6241. [8] 张钹,张铃.问题求解的理论及应用[M].北京:清华大学出版 社,2007. [9] 张燕平,张铃,吴涛.不同粒度世界的描述法——商空间法[J]. 计算机学报,2004,27(3):328-333. [10] Zhang L,Zhang B.The quotient space theory of problem solving[J].Fundamenta Informatcae,2004,59(2/3):287-298. [11] MATLAB 中文论坛.MATLAB 神经网络 30 个案例分析[M]. 北京:北京航空航天大学出版社,2010. (上接 220 页) 出版社,2005:15-22. 但是由于 IT 外包过程中的知识转移的特殊性和复杂 性,要构建一个具有足够灵活和智能化的风险决策支持系 统,尚有许多问题需要进一步研究,比如,如何寻求规则挖 掘支持度、如何评价规则挖掘的效果等,都是今后需要进 一步探讨的问题。 参考文献: [1] 张旭梅,刘春燕.企业 IT 外包中知识转移的风险防范与对策研 究[J].科技管理研究,2009(6):267-269. [2] 信妍.IT 外包中知识转移影响因素实证研究[J].情报杂志,2011 (6):111-114. [3] 张莉,齐中英,田也壮.知识转移的影响因素及转移过程研究[J]. 情报科学,2005,23(11). [4] 李勇.IT 外包中知识转移机制的研究[J].图书情报工作,2009, 53(4):124-127. [8] 钟嘉鸣,李订芳.基于粗糙集的 CAI 课件综合评价模型[J].计算 机工程与应用,2008,44(22):213-215. [9] 廖琳武,李垣,雷宏振.确定多属性群决策协调权的模型和方 法[J].管理科学学报,2006(9):33-39. [10] 黄沛,李剑.基于粗糙集的保险风险规则挖掘模型[J].系统工 程,2002(9):34-39. [11] 代建化.粗糙集理论及其在知识发现中的应用研究[D].武汉: 武汉大学,2003:97-104. [12] Gu Hui,Song Bifeng.Study on effectiveness evaluation of weapon systems based on grey relational analysis and TOPSIS[J].Journal of Systems Engineering and Electronics, 2009,20:106-111. [13] Chen H,Li T,Qiao S,et al.A rough set based dynamic maintenance approach for approximations in coarsening and refining attribute values[J].International Journal of Intelli- gent System,2010,25:1005-1026. [5] 张睿.技术联盟组织间知识转移过程和影响因素研究[D].哈尔 [14] 卢新元,张金隆,丛国栋.基于粗糙集的 IT 项目风险因素多元 滨:哈尔滨工业大学,2009. [6] 郑沛.IT 工程服务外包中知识转移相关问题及对策研究[J].江 苏科技信息,2010(9). [7] 张文修,仇国芳.基于粗糙集的不确定决策[M].北京:清华大学 组合权重研究与聚类分析[J].管理学报,2005(5). [15] Slezak D,Ziarko W.The investigation of the Bayesian rough set model[J].International Journal of Approximate Reasoning, 2005,40:81-91.
分享到:
收藏