logo资料库

基于LSTM的空气质量指数预测.pdf

第1页 / 共8页
第2页 / 共8页
第3页 / 共8页
第4页 / 共8页
第5页 / 共8页
第6页 / 共8页
第7页 / 共8页
第8页 / 共8页
资料共8页,全文预览结束
中国科技论文在线 http://www.paper.edu.cn 基于 LSTM 的空气质量指数预测 李映雪,温罗生** (重庆大学数学与统计学院,重庆 401331) 摘要:空气中的污染物浓度直接影响到空气质量指数(AQI),尤其是 PM2.5,PM10 等, 它能影响能见度、并且对人体的心血管系统造成不良影响。为了预测空气质量指数,以北京 市 2014 年 1 月-2020 年 2 月空气污染物监测数据为基础,首先基于 Python3.6 搭建了长短期 记忆(LSTM)模型。与传统神经网络不同的是,该模型通过添加遗忘门、输入门、输出门 到隐藏层来控制信息的传递。其次将该模型与 RNN 模型进行对比试验,试验结果表明:该 模型较 RNN 模型运行速度快,准确度高,能够有效地改善 RNN 网络处理长时间序列数据 时预测精度低的问题,能作为空气质量指数预测的有效手段。 关键词:计算机神经网络;门控神经网络;LSTM;空气质量指数 中图分类号:X511 Air quality index prediction based on LSTM LI Yingxue, WEN Luosheng (Department of mathematics and statisticc, chongqing University,Chongqing 401331,China) Abstract: The concentration of pollutants in the air- especially PM2.5 and PM10- directly affecting the air quality index(AQI), it can impact the visibility, and be harmful to the body's cardiovascular system. To predict the AQI, this paper tries to build a Long Short-Term Memory (LSTM) network with Python3.6, and to use the Beijing air pollutant monitoring data from January 2014 to February 2020. Unlike traditional recurrent neural networks, LSTM model controls the transmission of information in hidden layer by adding a forgotten gate, an input gate and an output gate. After doing a comparison experiment with RNN model, the experimental results show that the LSTM model can run faster and get more accuraAir quality index prediction based on LSTMte prediction than RNN. so LSTM model is very suitable for processing AQI. cause it can effectively improve the problem of low prediction accuracy when processing long time series data in RNN model. Key words: computer neural network; gated neural network; LSTM; AQI 5 10 15 20 25 30 0 引言 随着工业和制造业的发展以及车辆活动的增加,迅速的城镇化导致空气污染问题日益加 重。空气中的污染物浓度直接影响到空气质量指数,尤其是 PM2.5,PM10 等,它们直接影 响能见度、会对吸入者的心血管系统造成不良影响。中国的北方受到空气污染影响较大,为 35 了改善空气质量,需要实时对空气质量数据进行监测并采取针对性的措施。因此如何提高空 气质量预测的准确性得到众多学者的关注。本文选定空气质量指数(Air quality index,AQI) 作为空气质量预测的对象。AQI 值变化受到多因素的影响,例如 PM2.5,PM10,SO2,CO, NO2,O3-8h 等。 当 前 学 者 常 用 的 空 气 质 量 预 测 模 型 有 基 础 神 经 网 络 模 型 如 BP 神 经 网 络 作者简介:李映雪(1996-),女,硕士研究生,主要研究方向:基于机器学习的数学建模 通信联系人:温罗生(1975-),男,教授,博导,主要研究方向:最优化计算方法(大规模优化)、传 染病动力学、机器学习和工业领域的数学建模. E-mail: wls@cqu.edu.cn - 1 -
中国科技论文在线 http://www.paper.edu.cn 40 ( Backpropagation neural network,BPNN ) [1] 、 前 向 神 经 网 络 (Feedforward neural network,FNN)[2],深度神经网络如递归神经网络(Recurrent neural network,RNN)[3],卷积神 经网络(Convolutional neural network,CNN)等[4]。以及为了解决人工神经网络模型存在易陷入 局部极值、参数选取困难等问题而提出的一些改进模型,例如 GA-ANN[5]、IPSO-ELM[6]、 ASO-SVM[7]等。 45 使用 RNN 网络对空气质量指数进行预测时,通常使用基于时间的反向传播算法(Back Propagation Through Time, BPTT)进行训练。RNN 模型通过存储前面时刻的隐藏状态值用于 更新当前时刻隐藏状态,从而保证时间序列数据之间的依赖关系,由于网络是根据输入展开 的,因此当网络展开越深,反向传播的误差越大,那么对于“深度”网络容易出现梯度消失或 者梯度爆炸现象[8],即使梯度约减在一定程度上改善梯度消失问题,仍不能结局梯度爆炸问 50 题。基于此,本文拟采用长短期记忆模型(Long-Short Term Memory,LSTM)模型[9]对 PM2.5 浓度进行预测。和 RNN 不同,LSTM 在递归网络中添加了门控机制,能够长期的保存输入, 在长序列数据上预测表现更好。 1 基于 LSTM 网络的预测模型 1.1 LSTM 网络结构 55 LSTM 模型与标准递归神经网络模型类似,有一个隐藏层,但是隐藏层的每一个单元 由记忆单元替代,每个单元包含一个具有固定权重的自连接递归边缘的节点,确保梯度可以 通过多个时刻而不会消失或爆炸。LSTM 网络添加三个门(遗忘门、输入门、输出门)[10]到 隐藏层来控制信息的传递,这种门控机制可以解决 RNN 模型不能兼顾长时间序列数据的问 题。图 1 是 LSTM 模型的结构图: 60 1.1.1 LSTM 模型的元素 图 1 LSTM 模型结构图 Fig. 1 LSTM model tructure 65 (1)输入节点: 时刻的输入 与上一时刻的隐藏状态 。 (2)输入门 :用来确认哪些信息可以流入到记忆单元状态中,如果它的值为 0,那么 来自另一节点的信息将被切断,如果它的值为 1,那么来自其他节点的所有信息将通过[11], - 2 - ttx1th−ti
70 75 中国科技论文在线 其中 为 时刻候选状态。 http://www.paper.edu.cn (3)遗忘门 :用来确认哪些信息需要从记忆单元状态中删除[12]。 (4)记忆单元状态 : 的计算是控制信息从 时刻往 时刻传递的关键, 的更 新由 和 共同确定,且需要结合上一单元状态 和候选状态 。 (5)输出门 :用来确认哪些信息可以从记忆单元状态输出。 (6)隐藏状态 :由记忆单元状态 和输出门 共同决定: 80 (7)网络预测输出 : 其中激活函数 tanh 为正切函数, 取用 sigmoid 函数, 表示元素乘法, 表示当前 时刻的输入, 表示上一时刻的隐藏状态, 表示上一时刻记忆单元的状态, 表示 时刻记忆单元的状态, 分别表示输入门、遗忘门、输出门, 表示 时刻隐藏状态。 1.2 LSTM 模型的训练 85 LSTM 模型的参数在以上所有公式中已提出,分别为 , , 。 根据时间序列数据的特点, LSTM 训练过程和一般的神经网络存在差异,它使用 BPTT 方 法对参数进行训练。值得注意的是,LSTM 的误差主要包含两个方面,一方面是误差从输出 层传向输入层,另一方面,误差从当前时刻传向上一时刻[13]。BPTT 遵循链式求导法则,误 差反向传播的求导过程如下: 90 (1)定义损失函数。在 时刻,常用均方根误差函数 表示网络 输出和实际输出的损失,其中 M 为数据总个数,由于递归神经网络的特性, 对 时刻之后 的损失有影响,则 时刻的实际损失为 ,即 ,全局损失为 。 ( 2 ) 求 解 偏 导 。 在 BPTT 中 , 关 键 是 求 解 损 失 对 各 参 数 的 偏 导 , , 95 , ,这里为了书写方便,将参数统一简写为 ,即 有求解 ,注意到 , 可直接求到,在本文中不展开赘述。下面 - 3 - tgt1([,])tittiiwxhb−=+1tanh([,])tgttggwxhb−=+tf1([,])tfttffwxhb−=+tCtC1t−ttCtfti1tC−tg1tttttCfCig−=+to1([,])tottoowxhb−=+thtCto*tanh()ttthoC=^ty^()tytyVhb=+txt1th−1tC−tCt,,tttifothtVyb,,,figobbbb,,,figowwwwt2^11()MtttltyyM==−thttTtpptLl==1,,TtttltTLlLtT+==+1TttLL==V,,,figowwww,,,figobbbbW1TttLLWWW===LVyLb
中国科技论文在线 详细介绍损失对其他参数的偏导。 http://www.paper.edu.cn (2.1)根据链式求导法则,需要先求到 , 等变量,特殊的是,在 T 时刻,由于没 有反向传来的误差,则有 100 其中 (2.2)前向过程表明, 影响损失 是通过直接改变 与 的值。然而,修改 来影 响 只需要修改 的值。因此利用链式法则有: 105 其中 时, (2.3)由此可求到损失 对 的偏导如下: 110 (2.4)下面求到 对各参数的偏导如下: 115 - 4 - ttLhttLC1111,TTTTttttttttttttLltThhLhlLlLhtThhhhh++++===+=+,1111111111tttttttttttttthhuhghohuhghoh++++++++++=++tCtLth1th+tC1tL+1th+1111111111,TTTTttttttttttttttttttttttttttttLhtThCLCLhLhLhLhLhLhCtThChChChChChCC++++++++++==+=+=+,tT111111ttttttttLlLLhLhh++++++=+=tL,,,ttttifgo1tttttttttLLCLCfCfC−==tttttttttLLCLgiCiC==tttttttttLLCLigCgC==tanh()tttttttttLLhLCohoh==,,,ttttifgo1(1),(1)ttttttttixihiiiixiihww−=−=−1(1),(1)ttttttttfxfhffffxffhww−=−=−221(1),(1)ttttttgxghgggxghww−=−=−1(1),(1)ttttttttoxohooooxoohww−=−=−
中国科技论文在线 http://www.paper.edu.cn (2.5) 对各参数求导可得: , , 120 , , , , , , (3)参数更新公式: ,其中 是学习速率。 2 实例分析 125 2.1 数据获取 以 2014 年 1 月-2020 年 2 月北京空气质量为研究对象,数据取自于空气质量在线监测 分析平台[14],平台对 PM2.5,PM10,AQI,SO2,CO,NO2,O3_8h 进行采样,其中 PM2.5 浓度, PM10 浓度,AQI 数据是根据当天环保总站每小时数据计算求均值的结果。本数据集共 2244 组样本数据,取前 2018 组作为训练集,后 225 组作为测试集,用来对空气质量预测模型进 130 行训练和验证。下表是部分数据: 表 1 北京 2014 年 1 月-2020 年 2 月北京空气污染物浓度数据 Tab. 1 Beijing air pollutant monitoring data from January 2014 to February 2020 date AQI PM2.5/(g/m3) PM10/(g/m3) SO2/(g/m3) CO/(g/m3) NO2/(g/m3) O3_8h/(mg/m3) 2014/1/1 2014/1/2 2014/1/3 2014/1/4 … 2020/2/20 2020/2/21 2020/2/22 2020/2/23 81 145 74 149 … 143 100 40 58 2.2 实证结果分析 45 111 47 114 … 109 75 8 41 111 168 98 147 … 76 95 16 51 28 69 29 40 … 7 3 3 5 1.5 3.4 1.3 2.8 … 1.4 0.8 0.2 0.6 62 93 52 75 … 30 21 11 38 52 14 56 14 … 66 75 79 58 135 在本实验进行前可如图 2 对数据进行可视化,并计算 AQI 与其他指标的相关系数如表 2,经观察,AQI 值与 PM2.5、PM10 相关性较大。 - 5 - 2(1),(1),(1),(1)tttttttttttifgoifgoiiffgoobbbb=−=−=−=−tLtttixtixLLiwiw=tttihtihLLiwiw=tttitiLLibib=tttfxtfxLLfwfw=tttfhtfhLLfwfw=tttftfLLfbfb=tttgxtgxLLgwgw=tttghtghLLgwgw=tttgtgLLgbgb=tttoxtoxLLowow=tttohtohLLowow=tttotoLLobob=WWW=−
中国科技论文在线 http://www.paper.edu.cn 140 145 图 2 AQI、PM2.5、PM10、SO2、CO、NO2、O3_8h 指标的数值变化 Fig. 2 numerical values of AQI、PM2.5、PM10、SO2、CO、NO2、O3_8h 表 2 AQI 与其他指标的相关系数 Tab. 2 correlation coefficient between AQI and other indicators correlation coefficient AQI PM2.5 PM10 SO2 CO NO2 O3_8h AQI 1.000000 0.917108 0.827516 0.473515 0.751676 0.675467 0.169996 为验证 LSTM 模型性能,以相同数据组,选择 RNN 模型进行对比分析,利用训练集分 别对两预测模型进行训练,利用测试集对 LSTM 和 RNN 预测模型的预测性能进行对比验 证,其中评价指标采用均方误差(MSE),训练方法为 BPTT,得到各模型预测输出曲线和 实际值对比如图 3,评价指标对比如图 4: 150 图 3 RNN、LSTM 模型预测结果对比 Fig. 3 predicton values of RNN, LSTM - 6 -
中国科技论文在线 http://www.paper.edu.cn 图 4 RNN、LSTM 模型预测均方误差 Fig.4 prediction MSE of RNN, LSTM 155 由上图可知,在预测条件相同的情况下,与 RNN 模型相比,LSTM 模型对空气质量指 数 AQI 的预测更加精准。 3 结论 为了解决传统神经网络预测空气质量指数时出现的预测准确度低、预测效果不理想等问 160 题,本文首先基于 Python3.6 搭建了 LSTM 模型来对空气质量指数进行预测,并取北京 2014 年 1 月-2020 年 2 月的空气主要污染物数据,对 LSTM 模型进行仿真预测。由数据可视化发 现空气质量指标值和 PM2.5、PM10 浓度正相关。其次,将 LSMT 模型与 RNN 模型进行了 对比实验,实验结果表明,,LSTM 模型比常规 RNN 模型有更好的预测效果,即 LSTM 模 型能一定程度上解决 RNN 模型处理长时间序列数据时出现的梯度消失和梯度爆炸问题。因 165 此可将此模型应用于空气质量预测。 [参考文献] (References) [1] 宋宇辰, 甄莎. BP 神经网络和时间序列模型在包头市空气质量预测中的应用[J].干旱区资源与环境, 2013,7. 170 SONG Y C, ZHEN S. Application of BP Neural Network and Time Series Model in Air Quality Prediction in Baotou City[J]. Resources and Environment in Dry Areas, 2013,7. (in Chinese) [2] CORANI G. Air quality prediction in Milan: feed-forward neural networks pruned neural networks and lazy learning[J]. Ecological Modelling, 2005,185:513–529. [3] ATHIRA V, GEETHA P, VINAYAKUMAR R, et al. DeepAirNet: Applying Recurrent Networks for Air Quality 175 Prediction[J]. Procedia Computer Science 2018 ,132: 1394–1403. [4] LI T, ZHANG Z T, CHEN H. Predicting the combustion state of rotary kilns using a convolutional recurrent neural network[J]. Journal of Process Control,2019, 84:207–214 [5] 赵宏,刘爱霞,王恺,等.基于 GA-ANN 改进的空气质量预测模型.环境科学研究,2009,11 ZHAO H, LIU A X, WANG K, et al; Improved air quality prediction model based on GA-ANN[J]. Environmental 180 science research,2009,11. (in Chinese) - 7 -
中国科技论文在线 http://www.paper.edu.cn [6] 付亚丽,洪亚 .基于 IPSO-ELM 算法的空气质量预测[J].环境科学与技术,2017,S1 FU Y L, HONG Y. Air quality prediction based on IPSO-ELM algorithm[J]. Environmental science and technology, 2017,S1(in Chinese) [7] 倪志伟,朱旭辉,程美英.基于人工鱼群和分形维数融合 SVM 的空气质量预测方法[J].模式识别与人工 185 智能, 2016,12 NI Z W, ZHU X H, CHENG M Y. Air quality prediction method based on SVM with artificial fish and fractal dimension fusion[J]. Pattern recognition and artificial intelligence,2016.12.(in Chinese) [8] 李想. 基于递归神经网络的快速车辆轨迹数据预测[D]中国矿业大学,2019 LI X. Fast vehicle trajectory data prediction based on recurrent neural network[D]. China Mining University,2019 190 [9] YU C J, LI Y L, BAO Y L, et al. A novel framework for wind speed prediction based on recurrent neural networks and support vector machine[J]. Energy Conversion and Management, 2018,178:137-145 [10] SONG X Y, LIU Y T, XUE L, et al. Time-series well performance prediction based on Long Short-Term Memory (LSTM) neural network model[J]. Journal of Petroleum Science and Engineering,2020,186:106682 [11] ZHANG J F, ZHU Y, ZHANG X P, et al. Developing a Long Short-Term Memory (LSTM) based model for 195 predicting water table depth in agricultural areas[J]. Journal of Hydrology, 2018,561 :918–929. [12] HAN Y M, FAN C Y, XU M, et al. Production capacity analysis and energy saving of complex chemical processes using LSTM based on attention mechanism [J]. Applied Thermal Engineering 2019,160: 114072 [13] PEI S Q, QIN H, ZHANG Z D, et al. Wind speed prediction method based on Empirical Wavelet Transform and New Cell Update Long Short-Term Memory network[J]. Energy Conversion and Management , 2019,196: 779– 200 792. [14] data: https://www.aqistudy.cn/historydata/ - 8 -
分享到:
收藏