论文研究-BP神经网络模型的改进.pdf-资料库

年月系统工程理论与实践第期神经网络模型的改进高洪深陶有德北方工业大学 , 北京信阳师范学院 , 河南摘要本文在深入研究理方法 , 并通过仿真试验实践表明 , 这些改进和技术处理方法是有效的神经网络模型的基础上 , 提出了对该模型的若干改进技术处 , 〕叮 , , , , 一 , ’, 引言在神经网络模型中 , 其中最具有代表意义和广泛用途的是神经网络模型神经网络模型是由输入层、输出层和若干隐含层组成的前向连接模型 , 同层各神经元互不连接 , 相邻层的神经元通过权连接 , 最基本的神经网络是三层前馈网络 , 神经网络模型的逆传播算法具有思路清晰、结构严谨、可操作性强等特点 , 并且由于隐含节点的引入 , 使得一个三层的具有神经元的非线性网络可以以任意精度逼近任何连续函数 , 因而在很多领域中都得到了广泛的应用但是 , 这种算法也存在以下缺点从数学上看它归纳为一非线性梯度优化问题 , 因此不可避免地存在有局部极小问题学习算法的收敛速度很慢 , 通常需要上千次迭代或者更多网络的结构为前向结构 , 没有反馈连接 , 因此它是一个非线性映射系统网络隐含节点的个数尚无理论上的指导对新加入的样本要影响己经学完的样本 , 刻划每个输入样本的特征的数目也要求必须相同为了克服神经网络的上述缺点 , 提高模型的收敛速度和预测精度 , 我们在神经网络模型的逆传播算法的基础上进行了若干改进 , 获得了很好的效果本文于年月日收到 ,

系统工程理论与实践年月模型网络结构的改进通过改进神经网络结构 , 可以不断提高模型的学习能力、预测精度和稳定性 , 并能加快网络的收敛速度模型网络结构的改进 , 主要包括以下几个方面互连方式线性系统可以看作是非线性系统的一种特殊情况 , 因此构造和设计非线性预测模型时 , 应当注意使模型能够用于线性预测 , 从而使得模型具有较强的适应性在传统的逆传播模型中模型 , 各层的神经节点只能将信号向上层传送 , 故称为前向神经网络如果各神经节点上的转换函数函数或其他非线性函数 , 这种网络很难拟合输出变量和输入变量之间的线性关系为解决这一问题 , 在前向神经网络中 , 输入神经节点可以直接与输出神经节点相连二者之间的权重 , 不用通常的学习过程去逐步调整 , 而是用线性回归或其他方式计算出来这样能加快模型的收敛速度和增加模型的稳定性 , 转换函数输入节点和隐含节点、隐含节点和输出节点之间转换函数的设定是逆传播模型研究的一个重要问题常用的转换函数包括以下几种类型阑值型转换函数转换函数分段线性转换函数恒等线性转换函数 · 为了更好地拟合变量之间的复杂关系 , 除上述转换函数外 , 可以根据问题的需要 , 选用包括钟型函数、正弦函数等其他非增可微函数此外 , 还可以尝试在隐含层和输出层的各个节点设定不同类型的转换函数例如 , 在输出设定函数等不同类型的转换函数其中 , 后两个不是单调函数 , 最后一个是周期函数函数 , 在隐含层设定包括函数、钟型函数和正弦 , 隐含节点如何确定隐含层的节点的个数是神经网络应用中经常遇到的问题和提出了级联相关式结构 , 将隐含层的点一个一个逐次引进 , 得到一个层次不断增高的神经网络这一方法的优点是能层次化地得到一个比较好的网络结构和节省计算时间 , 不足之处是最后得到的网络层次高 , 输出变量一输入变量的关系一般较复杂 , 解释起来很不方便在述基本思路的基础上 , 可以做进一步的改进 , 即隐含点分批引进法它的基本指导思想是 , 在训练过程中 , 网络的层次保持不变 , 隐含层的点从一个或几个开始 , 对相应的权重训练好以后引进一个或几个新的点 , 只训练新引进的权重 , 直至结果不能改进为止实践表明 , 当隐含层的点应用不同类型的转换函数时 , 每次引进儿个点往往能取得好效果此外 , 网络初始参数的设置 , 包括连接权值和阑值的不同选取 , 可能会对网络的收敛速度产生影响因此 , 选取适当的初始权值和阑值 , 是改进网络收敛速度的有效途径之一由于神经网络配置优化的概念至今没有一个明确的定义 , 因而对网络节点的互连方式、转换函数的类型、隐含节点的个数和网络初始参数等的选择 , 除进行若干技术处理外 , 主要还要依赖建模者的观察和经验模型学习算法的改进模型学习算法亦称逆传播学习算法和这种算法具有直观、简单等优点 , 可以编制程序在计算机实现 , 它的缺点是学习速度很慢 , 一般需要上千次迭代或者更多 , 并且容易陷入局部最小 , 影响网络的收敛速度为了提高我们偿试以下途径 , 取得较好的效果网络模型的学习速度 , 添加惯性冲量为减少学习过程中的振荡 , 在调整权值时 , 采用的添加惯性冲量技术通过添加惯性冲量 , 以滤除学习过程中的高频振荡 , 使学习率可以取较大的值 , 从而加快学习

第期神经网络模罕的改进速度此时 , 权值调整的般形式为 △诚 , 艺二毕娜 · 仇斗一印八诚。娜其中 △诚价为节点二与节点匀在时刻艺的连接权值的改变量 , 刀和 ‘喷性因子 , 石对为节点劣 , 的误差 , 杯为节点八的输出或输入 · 和。分别为学习率批处理学习样本在传统的学习算法中 , 每给网络提供一个学习样本 , 都计算误差函数并进行连续连接权值调整批处理学习样本则是当所有的样本都提交给网络后 , 根据输出错误的平均一方面减少了网络学习的时问 , 另一方面避免了因逐个样本变值统一对网络进行一次调整这样 , 更而产生的权值过调现象 , 从而加快了网络的学习速度当样本足够多时 , 学习样本的批处理方法 , 能够体现样本的统计规律性跳跃学习在学习过程中可能有一些样本率先达到很小的误差 , 如果这时仍然对它们进行前向传播和逆向传播的计算势必造成时间浪费 , 进而影响网络的学习速度因为它们对网络性能的改变贡献很小 , 甚至是不利的 , 可能使网络对这些样本的针对性过强为了防止这一现象 , 可以设置一个最小误差 , 若某样本产生的输出误差小于这个给定的最小误差 , 则不对它进行逆向传播的计算考虑到网络变化的连续性 , 一次学习时连前向传播计算也略去 , 而径直给这样本的误差加上一个很小的值作为它新的误差这一处理方法称作跳跃学习 , 跳跃学习直至其误差超过最小误差 , 再次进行权值修正基于模拟退火的方法为使误差函数曲面迅速跳出局部最小并达到全部最小 , 可以采用基于模拟退火的方法该方法的基本指导思想是 , 先赋给学习率以较大的数值 , 使得网络的权值获取较大的改变量 , 进血使得网络获取较大的误差 , 从而跳出局部最小然后逐渐减小学习率 , 使网络平稳地达到全局最小这种学习率先大后小的方式与金属构件退火过程类似 , 但区别于模拟退火方法 , 因此称作基于模拟退火的方法误差动态调整学习率 , 和 ‘赓性因子。这种方法的基本思路是 , 依据第之次迭代后占个样本总的与第扭一次迭代后百个样本总的误差扛一的改变量 △ 约的符号判定第次迭代的性质 , 即判定第云次迭代是有效迭代还是无效迭代 , 然后采用不同的规则动态调整叮和。进而调整各神经节点的连接权值和团信由于在学习过程中 , 消除了无效迭代 , 从而加快了网络的学习速度动态调整学习刀和惯性因子。的具体步骤如下二令万若 △刃〔幻二刀一君汁一。, 则表明第忿次迭代是有效迭代 , 此时 , 按下式调整 ”和 , , 艺二 , 孟入刀入〔食艺斗一。入。亡入任 , , 同时对连接权值作下述调整诚 , 艺二诚 , 艺。十 · 万, , , 、十一。 ‘ · 诚、‘ 一诚、‘ 一若 △ 劝约一召。一全 , 则表明第艺次迭代是无效迭代 , 此时 , 按下式调整刀和叮刀亡一入刀艺入任 ,

系统工程理论与实践年月同时对连接权值作下述调整。巧。。一入。入任 , 城 , ‘ 诚 , ‘ 一刀 ‘ · 场 · , ‘ · 诚 , ‘ 一一城 , 一」其中 , 好, 与式中的好, 不同 , 前者取一次迭代的结果 , 后者取第艺次迭代的结果权重贡献率和关键神经节点本文在深入研究和探讨逆传播神经网络模型的基础上 , 提出了权重贡献率分析方法和关键神经节点的概念 , 通过对权重贡献率的分析研究和关键神经节点的提取 , 用尽可能少的变量建立模型 , 并且具有较高的精度权重贡献率权重贡献率分析法是用来分析研究输入神经节点的权值分布的一种方法其基本原理就是 , 通过分析各个输入神经节点权值占整个输入神经节点对输出比例的大小 , 确定其每个输入神经节点对输出神经节点的影响程度 , 按输入神经节点权重贡献率由大到小进行排序 , 确定出关键神经节点 , 消除非关键神经节点 , 从而提高建模精度为进行神经网络权值的研究 , 首先将所有与输入神经节点连接的权值取绝对值 , 然后分别按各个输入神经节点求和 , 称之为输入神经节点的权值或权重将所有输入神经节点的权值相加得到输入神经节点的总权重 , 并分别计算各个输入节点权重总权重的百分比 , 称之为权重贡献率通过分析权重贡献率的大小可确定关键输入神经节点 , 其具体步骤如下将输入神经节点按权重贡献率降序排 , 记为币飞, …月飞无选取界限值 “, 确定整数 “ , 使得艺诚全 “· ”的选取可根据具体情况而定 , 一般取 “ 全 · 葱将满足上述不等式的权重对应的个节点记作 , 几 , … , 币飞, 称之为关键神经节点 , 而余下的一节点记作 , 不尹飞 , … , 环佑称之为非关键神经节点研究输入神经节点的权重贡献率 , 确定关键神经节点的意义在于在所建模型中 , 可实现用 , , … , 下信息代替对 , 叭 , … , 城 , 的信息处理用部分样本建立原始模型 , 从中确定关键神经节点 , 币飞, … , 瓦, 然后用所得的个节点重新建模 , 其精度不低于用几个节点所建的模型 , 从而加快模型的收敛速度和减少不必要的信息收集工作为了验证上述结论 , 我们采用了以下两种方法在原始模型中 , 将检验数据集中的非关键神经节点环飞 , 环气 , … , 功心赋零值 , 其余不变 , 让模型进行预测在训练数据中的非关键神经节点下花几 , 环飞 , … , , 赋零值 , 建立新的模型 , 模型的输入神经节点的数目仍为个 , 然后将检验数据集中的非关键神经节点赋零值 , 让模型进行预测试验的结果表明 , 两种预测的结果均与原始模型的预测结果相当接近 , 从而再一次证实非关键神经节点币币认 , 环飞 , … , 下犷的信息对预测的结果没有多大影响 , 完全有理由在模型中剔除这些节点关键神经节点

第期神经网络模型的改进如上所述 , 通过对输入神经节点权值的研究 , 按着权重贡献率的大小 , 确定出关键神经节点和非关键神经节点利用关键神经节点重新建模 , 其精度不低于原始模型为提高模型精度 , 加快收敛速度 , 可以考虑在新的模型中继续提取关键神经节点 , 并建立新的网络模型这就是关键神经节点提取法的基本思想由于原始模型中输入神经节点的数目是有限的 , 因而关键神经节点的提取不可能无限制地进行下去 , 在经过有限次提取以后必须终止提取关键神经节点的终止原则是剔除任一节点后 , 如果余下节点要权绝对值之和占输入神经节点权值总和的比例小于界限值 , 则终止提取关键神经节点提取的一般步骤为建立基于将各输入神经节点按权重贡献大小降序排列 , 记为网络非线性预测模型 , 并计算各个输入神经节点的权重贡献率讼, … , 诚若存在正整数 “ 使得艺诚全艺 , 则提取 “ 个关键神经节点 , 并重复上述步骤 , , 否则 , 转终止提取 · 综上所述 , 提取关键神经节点方法可使用尽可能少的变量建立模型 , 并且具有较高的预测精度并且在一定程度上实现在信息残缺的情况下作出正确的预测结束语神经网络模型及其算法 , 在许多领域已得到广泛的应用 , 但是也存在着严重缺陷因此 , 国内外的许多学者对此做了许多工作 , 也作了一些改进本文在他们所做工作的基础上 , 作了大量的有神经网络模型若干改进和技术处理方法 , 并进行仿真试验仿真结果益的探索和研究 , 提出了对及方法另发实践表明 , 本文所提及的改进与技术处理方法是有效的 , 提高了网络模型的学习速度 , 加快了网络的收敛 , 改善了模型的预测精度参考文献孔 , , , , , 戴汝为 · 从定性到定量的综合集成技术 , 模式识别与人工智能 , , 杜利民 , 候自强 · 多层前馈神经网络快速学习算法的实现 , 电子学报 , 一 , 一

资料库

论文研究-BP神经网络模型的改进.pdf

相关推荐

开发技术

热门标签

最新资料