logo资料库

论文研究-遗传神经网络在近红外光谱煤质分析中的应用 .pdf

第1页 / 共6页
第2页 / 共6页
第3页 / 共6页
第4页 / 共6页
第5页 / 共6页
第6页 / 共6页
资料共6页,全文预览结束
中国科技论文在线 http://www.paper.edu.cn 遗传神经网络在近红外光谱煤质分析中的应用 雷萌 1,李明 1,徐志彬 2 1 中国矿业大学信息与电气工程学院,江苏徐州 (221008) 2 河北出入境检验检疫局京唐港办事处,河北唐山 (063611) E-mail:leimengniee@163.com 摘要:针对 BP 神经网络收敛速度慢及容易陷入局部最优解的缺点,本文结合遗传算法全局 搜索的特点,提出了一种基于遗传算法的 BP 神经网络建立近红外光谱煤质分析模型。由于 煤炭样品的光谱波长点较多,本文利用主成分分析法提取主成分值,有效地进行了数据压缩。 实验对比了 BP 模型与 GA-BP 模型,GA-BP 模型有效地减小了测试集的预测值与真实值之间 的误差平方和,相关系数也得到了提高。此方法可可以有效地提高预测精度和分析速度。 关键字:煤质分析;近红外光谱;主成分分析;BP 神经网络;遗传算法 1. 引言 煤炭是国家的重要能源,无论是煤炭的开发、利用或是精加工、深加工都离不开煤质分 析[1],因此快速而又准确的测定出煤质中各物质的含量显得尤为重要。传统的测定方法主要 有通氮干燥法、空气干燥法及微波干燥法,但普遍存在的不足是分析时间长、测定精度低、 破坏样品结构等[2]。鉴于传统测定方法的缺陷,利用近红外光谱分析技术快速、无损地对煤 炭各成份含量的检测,将会成为煤质分析未来发展的主要趋势。 煤炭工业分析包括水份、灰份、挥发份和固定碳 4 项[3]。本文以水份测量为例,通过对 煤炭样品的近红外光谱数据进行建模分析,来预测煤炭样品中水份的含量。本文中,利用主 成分分析法建立分析校正模型并提取煤炭样品的主成分,并将提取的主成分作为 BP 神经网 络模型的输入神经元,水份含量为输出神经元,对待测煤炭样品水份的含量进行预测。在建 立 BP 神经网络模型时,利用遗传算法对网络的权值和阈值进行优化。 2. 实验数据与方法 2.1 光谱采集 图1 70个煤炭样品光谱 Fig1 Spectrum of 70 samples of coal 400060008000100000.811.21.4波长点(cm-1)吸光度70组煤炭样品光谱图-1-
中国科技论文在线 http://www.paper.edu.cn 本文中的数据来自某市出入境检验检疫局从 2009 年 6 月至 2009 年 9 月的部分煤炭近红 外光谱检测数据。光谱由 Nicolet 公司的 Antaris II 型傅里叶变换近红外光谱分析仪采集,分 析仪采样参数设置见表 1。 表1 分析仪采样参数设置 Tab. 1: Sampling parameters 煤炭样品的数量 波长范围 (cm-1) 波长点数 样品扫描次数 分辨率 70 3799.0793~10001.0283 1609 64 8 2.2 主成分分析法 主成分分析方法(Principal Component Analysis,简称 PCA)是利用数学上处理降维的思 想,将实际问题中的多个指标设法重新组合成一组新的少数几个综合指标来代替原来指标的 一种多元统计方法。通常把转化生成的综合指标称为主成分,其中每个主成分都是原始变量 的线形组合,且各个主成分之间互不相关,还要尽可能多的反映原来指标的信息[4]。每个指 标都是原有指标的函数,但新指标总数少于原有指标数,这样新指标既保留了原有指标的主 要信息,又减少了指标个数,通过对指标的选择,在一定程度上还能滤除噪音。 2.3 BP 神经网络 BP 神经网络(Back-Propagation Neural Network)是应用最广泛的人工神经网络。BP 算法 的核心是通过一边向后传播误差,一边修正误差的方法来不断调节网络参数(权值、阈值), 以实现或逼近所希望的输出输入映射关系。BP 网络能够根据网络的实际输出与期望输出之 间的最小均方差值,通过误差的反向传播,利用梯度下降法迭代调整神经元之间的权值与阈 值,直至收敛于较小的均方差。它的训练预测结果常依赖于权值和阈值的设置,通过梯度下 降法在权空间中寻找问题的最优解,故收敛速度慢且易陷入局部极小值[5]。图 2 所示的为一 个典型的三层 BP 神经网络。 图2 BP神经网络结构图 Fig 2 Model structure of BP neural network 2.4 遗传算法 -2-
中国科技论文在线 http://www.paper.edu.cn 遗传算法( Genetic algorithms,简称 GA)是模拟生物在自然环境中的遗传和进化过程而 形成的一种自适应全局优化概率搜索算法。它是从代表问题可能潜在解集的一个种群开始 的,而一个种群则由经过基因编码的一定数目的个体组成。每个个体实际上是染色体带有特 征的实体。初始代种群产生之后,仿照生物学中适者生存和优胜劣汰的原理,逐代演化产生 出越来越好的近似解。在每一代,根据问题域中个体的适应度大小挑选个体,并借助于自然 遗传学的遗传算子进行组合交叉和变异,产生出代表新的解集的种群。这个过程将导致种群 像自然进化一样的后代种群比前代更加适应于环境,末代种群中的最优个体经过解码,可以 作为问题最优解。遗传算法全局搜索能力较强,可以有效的避免陷入局部最优解[6]。 3. 实验步骤与分析 3.1 主成分分析 由表 1 可知每个煤炭样品的波长点数为 1609 个,若不进行主成分提取,参与建立煤质 分析模型的输入端将有 1609 个,大大的增加了计算量,而且有些区域样品的光谱信息区域 有噪声,造成某一成份浓度的预测值与其真实值之间的决定系数比较小,影响了模型的准确 性。将 1609 个波长点作为主成分的输入变量,经主成分分析后,得到 5 个主成分的特征值 及累计可信度,如表 2 所示。 表2 主成分的特征值及累计可信度 Tab. 2: PCS and reliabilities 主成分 PC1 PC2 PC3 PC4 PC5 累计可信度/% 96.1910 99.2893 99.6459 99.8134 99.8828 3.2 GA-BP 模型 为了取得较高的预测精度和较快的收敛速度,本文设计出了一种基于遗传算法的优化 BP 神经网络。利用遗传算法在全局搜索 BP 神经网络的全局最优的初始权值和阈值,构建 近红外光谱煤质分析模型,来实现预测功能。基于遗传算法的 BP 神经网络模型(GA-BP 模 型)实现的流程如图 3 示,主要实现步骤如下: (1) 编码,采用十进制编码。构建三层的 BP 网络,输入层节点数为 5(主成分的个数),隐含 层节点数为 10,输出层节点数为 1,连接权值个数为 60,阈值个数为 11,共 71 个参数, 每个参数用一位十进制表示,联起来形成一条染色体(个体),其中染色体长度为 71。 (2) 初始群体,随机产生 50 个个体,每个个体的染色体是由 71 个十进制字符串组成。 (3) 目标函数确定,选取训练集误差平方和的倒数作为目标函数 f(x)。 其中,st 为煤炭样品训练集水份含量的真实值,pt 为预测值。 (4) 适应度函数确定,本文中的最优化问题是求目标函数的最大值,且都为正值,所以适应 度函数 F(X)=f(x)。 211()()nttifxsp-3-
中国科技论文在线 http://www.paper.edu.cn (5) 选择,选用“轮盘赌”法,即第 i 个个体被选择的概率 pi 为: (6) 交叉,单点交叉操作破坏个体形状和价格个体适应度的可能性最小,采用的交叉方式为 普通单点交叉方式。 (7) 变异,本文选取基本变位算,即以一定概率 pm 随机制定的某一位基因座上的基因值作 变异运算。如果所选的基因的编码为 1,则变为 0;反之编码为 0,则变为 1。 (8) 重复步骤 5-7,直至得到适应度最大的个体,作为 BP 网络的初始权值和阈值,训练网络。 图3 GA-BP模型流程图 Fig3 Flow of GA-BP model 3.3 实验结果与分析 本文中建立了一个 3 层 BP 神经网络模型,利用主成分分析法,选取贡献率较大的前 5 个主成分作为网络的输入神经元,1 个输出神经元(煤炭样品中水份含量的预测值)。共采 集了 70 组煤炭样品,其中 50 组作为训练集,20 组作为测试集。使用遗传算法对 BP 神经网 络的连接权值、阈值进行优化挑选。最佳个体适应度进化过程如图 4 所示,表示到当前进化 代为止的最佳个体适应度的变化趋势。 1iNinnFpF-4-
中国科技论文在线 http://www.paper.edu.cn 图4 适应度函数进化过程 Fig 4 Evolution process of fitness function 实验分析对比了 BP 神经网络模型与 GA-BP 神经网络模型的预测能力,两种模型预测 煤炭样品水份含量及对比结果如表 3 所示,预测值与真实值间的误差平方和减少了约 33%, 相关系数由 0.8689 增加到 0.9023。结果表明,基于遗传算法的 BP 神经网络模型的预测能力 比较强。 表3 BP模型与GA-BP模型预测值 Tab. 3: Values of test samples by BP model and GA-BP model 真实值 BP模型 GA-BP模型 真实值 BP模型 GA-BP模型 0.1510 0.1060 0.0770 0.0800 0.1540 0.1740 0.1690 0.1610 0.2550 0.1930 误差平方和 4. 总结 0.1579 0.1260 0.0638 0.0640 0.1651 0.1623 0.1691 0.1366 0.2048 0.1741 0.0151 0.1593 0.1204 0.0815 0.0604 0.1724 0.1636 0.1813 0.1393 0.2065 0.1656 0.0102 0.2130 0.1670 0.2060 0.1900 0.1910 0.1850 0.1870 0.1600 0.2170 0.1920 相关系数 0.17568 0.1070 0.1757 0.1801 0.1740 0.1620 0.1678 0.1124 0.2402 0.1690 0.8689 0.1815 0.1620 0.1777 0.1857 0.1759 0.1526 0.1556 0.1331 0.2241 0.1712 0.9023 近红外光谱技术可以对煤炭样品进行快速、无损地检测,但得到只是光谱数据,为了得 到比较直观的水份含量值,还需要建立一个关于光谱数据及其相应水份含量值的预测模型。 本文中提出了一种基于 GA-BP 的近红外光谱煤质分析模型,此模型结合了遗传算法和 BP 神经网络的优点,较好地解决了 BP 神经网络收敛速度缓慢,易陷入局部极小解的问题。实 验结果说明,此方法可以根据光谱数据有效地预测煤炭样品中水份的含量,同时该模型也可 以用来检测煤炭样品中挥发份,灰份等物质的含量。 -5-
中国科技论文在线 http://www.paper.edu.cn 参考文献 [1] 王刚.浅谈煤质分析[J].本钢技术,2008(5):24-26. [2] JM Andres, MT Bona. Analysis of coal by diffuse reflectance near-infrared spectroscopy [J]. Analytica Chimica Acta, 2005,Vol 535(no.1-2):123-132. [3] 顾志荣,张德强.红外快速煤质分析仪应用探讨[J].煤质技术,2008(2):24-30 . [4] 何晓群.多元统计分析[M].北京:中国人民大学出版社,2004. [5] 段军彪,景旭,上官周平.基于遗传算法的BP网络在小流域侵蚀量预测中的应用[J ].西北农业学报,2008,17 (2) : 317-320. [6] 王小平,曹立明.遗传算法理论、应用与软件实现[M].西安:西安交通大学出版社,2002. Application of Genetic Neural Network to Coal Analysis with Near-infrared Spectroscopy Lei Meng1, Li Ming1, Xu Zhibin2 1 School of Information and Electrical Engineering, China University of Mining and Technology, Xuzhou, Jiangsu (221008) 2 Jing Tang Gang office of Hebei Entry-Exit Inspection and Quarantine Bureau, Tangshan, Hebei (063611) Abstract Aimed at the shortcomings of the back-propagation (BP) neural network, such as slow convergence, easily getting local optimums, a new BP neural network model base on genetic algorithm (GA), a global searching method, was proposed to build coal analysis model using near infrared spectra in this paper. Due to the larger number of wavelength point, the principal component analysis (PCA) was used to compress data. Compared with the results of traditional BP neural network model, the new BP neural network model based on genetic algorithms (GA-BP) could not only reduce the error sum squares between the predictive value and truth value, but also improve the correlation coefficient R. It can be concluded that the method can improve the precision of prediction and the speed of analysis. Keywords: Coal Analysis; Near Infrared Spectroscopy (NIRS); Principal Component Analysis; BP Neural Network; Genetic Algorithms -6-
分享到:
收藏