logo资料库

基于BP神经网络的流感病毒预测.pdf

第1页 / 共9页
第2页 / 共9页
第3页 / 共9页
第4页 / 共9页
第5页 / 共9页
第6页 / 共9页
第7页 / 共9页
第8页 / 共9页
资料共9页,剩余部分请下载后查看
中国科技论文在线 http://www.paper.edu.cn 基于 BP 神经网络的流感病毒预测 林权,张亚鹏 中国矿业大学理学院数学系,江苏徐州(221008) E-mail: linquan520147@126.com 摘 要:本文研究了流感病毒爆发程度的预测问题。病毒爆发情况的预测直接关系到疫苗的 使用效果,本文依据病毒的传播特性和各大洲的地理特征将全球分成了容易研究的十二个区 域,然后在一定的规则下从各国中选出了分布在 12 个地区的 30 个国家,对其中每个国家建 立 BP 神经网络模型,并根据往年的大量数据对网络进行充足训练,对这 30 个国家分别进 行了预测,最终选出了 H1N1 病毒、H3N2 病毒、B 病毒预测爆发程度最高的国家,即该病 毒威胁最大的国家,经过实际数据检验证明本文所建立模型结果较为理想。 关键词:流感病毒;BP 神经网络;预测 中图分类号:O29 0 引言 流感病毒引起的流行性感冒是一种急性病毒性呼吸道传染病,传染是导致人类死亡的主 要原因之一[1-2],尤其是当前高致病性禽流感在染,严重威胁人类的生命安全,防治流感病 毒药物的研究成为热点之一. 戴红安[3]等通过红细胞凝集抑制试验(HI 试验),对蛋用雏鸡使 用重组禽流感病毒灭活疫苗(H5N1 型,Re-1 株)和某种禽流感重组二联活疫苗的不同免疫程序 的免疫效果进行监测,掌握禽流感 HI 抗体产生及消长规律,制定适合的种鸡和商品蛋鸡预防 高致病性禽流感的免疫程序和免疫规范。柴丽娜[4]等通过 HI 试验发现人类对禽流感、新城 疫病毒均有一定的易感性,而且相关人员比非相关人员的抗体水平普遍偏高。在流感病毒的 研究方面,发现对于流感病毒预测方面的文献相对缺乏,对此本文提出了基于 BP 神经网络 的流感病毒的预测方法。 1 对病原地初步筛选 对流感病毒的预测需要较高的精度,因此本文根据假设 5 及各大洲的地理特征(如山脉 或河流),对洲际分划进行了细致的划分,共将地球分为十二个区域。 图 1 基于地理特征的流感区域划分 即非洲北部和西亚,美洲北部,亚洲东部,南亚,亚洲中部和俄罗斯大部,欧洲西部, -1-
中国科技论文在线 美洲中部,大洋洲,非洲南部,东南亚,南美洲(东),南美洲(西)。如图 1 所示 http://www.paper.edu.cn 由于每年二月份要预测新的流行季节中流感流行情况,故上一流行季节各月份各种类病 毒的爆发情况对预测有重要影响对威胁最大的流感病毒进行预测,本文制订了简易的初步筛 选规则(针对前一年流行季节的流感数据): 某种病毒在单月中的爆发程度在本地区最高的国家,进入病毒采样候选地 区(考虑最 大爆发程度在两星及以上的国家) 若第一步选出的国家不足三个,可利用已量化的流感爆发程度表计算流行季节中总的流 感爆发严重程度,选出前几位,直至选出三个国家(若数据不足,酌情处理)。 利用大洲分划,经过初步筛选,得到不同地区若干个病毒威胁最大的疑似国家或地区, 见表 1 与表 2: 表 1 北半球区域划分及病毒威胁最大的疑似国家或地区 北半球区域划分 非洲北部和西亚 美洲中部 美洲北部 亚洲东部 南亚 亚洲中部和俄罗斯大部 东南亚 欧洲西部 病毒威胁最大的疑似国家 突尼斯,摩洛哥 ,埃及 墨西哥,哥斯达黎加 加拿大,美国 中国香港地区,日本,韩国 中国 印度,巴基斯坦 俄罗斯 新加坡,泰国,菲律宾 挪威,英国,瑞典 荷兰 西班牙,葡萄牙 表 2 南半球区域划分及病毒威胁最大的疑似国家 南半球区域划分 南美洲(东) 南美洲(西) 非洲南部 大洋洲 病毒威胁最大的疑似国家 阿根廷,巴西 智利 厄瓜多尔 马达加斯加,喀麦隆 肯尼亚 澳大利亚,新西兰 在得到病毒威胁最大的疑似国家后,本文根据 2007 年 9 月至 2009 年 1 月的数据利用 BP 神经网络模型对其进行了进一步筛选。 2 BP 神经网络的原理 BP 神经网络[5]是模仿人脑的神经系统进行仿真的,它具有极高的自适应能力。在仿真 系统,存在着输入与输出的对应关系。这种对应关系并非线性类型,而是受多种复杂因素约 束与影响。用 BP 神经网络建立仿真预测系统,可以客观地描述这种复杂的因果关系。但是 BP 算法是一种简单的最速下降静态寻优算法,其主要缺点表现在一下几方面: 1、采用残差平方和最小作为目标函数,会过分地突出极大值的影响; 2、由于采用基于梯度的搜索方法,需要很好定义的可微分面,难以解决具有局部最小 的复杂欺骗性问题,尤其当求取一般非凸目标函数的全局最优解; 3、学习算法的收敛速度很慢,通常需要较长时间才能收敛。 BP 神经网络由三层组成输入层,隐含层,输出层如图 2 所示。 -2-
中国科技论文在线 http://www.paper.edu.cn 图 2 神经网络的拓扑结构 3 数值试验 利用 BP 神经网络模型来预测各地区的对应各种亚种(H1,H3,A,B)的具体品种在下一 年的爆发程度,从而从中挑选出威胁性较大的品种,并给出可能造成的威胁大小的排序,以 为病毒专家进一步选择威胁性较大的品种实验提供参考,大大缩小其的研究范围。 对要研究的某地区的某病毒品种,不妨以某地的 H3 病毒为例,以每月为研究对象,对 其可能的影响因素有月平均气温值; 该月是否打过该种疫苗(各月是否爆发与上月有关,故若某月打过该种疫苗后会影响到 下个月的情况); 由于北(南)半球各月间月平均气温情况的总体变化的可以看作一致的,所以只要量化 时大体区分出各月的高低即可。 则由该地区的 17 个月(从 2007 年 9 月到 2009 年 1 月)的以上各因素值以及该 H3 品 种病毒的爆发程度来训练和测试(可以用 2007 年 9 月到 2008 年 11 月数据做训练,用 2008 年 12 月、2009 年 1 做测试),来估计 2009 年 2 月到 2010 年 1 月的情况。 数据整理方式如图 3: 07 年 9 月至 08 年 11 月各地疫情 2008.12&2009.1 测试 预测 2009 年 2 月到 2010 年 1 月各地疫情 图 3 各地疫情 以加拿大的 H3N2 病毒品种情况为例: H1/加拿大 2007.9 2007.10 2007.11 2007.12 2008.1 2008.2 2008.3 2008.4 表 3 学习病毒爆发程度规律 是否接种 平均气温/度 H3N2 程度 1 0 0 0 0 0 0 0 15 9 3 -3 -5 -5 -1 5 -3- 1 1 1 1 1 1 1 1
中国科技论文在线 2008.5 2008.6 2008.7 2008.8 2008.9 2008.10 2008.11 2008.12 2009.1 0 0 0 0 1 0 0 0 0 12 17 20 19 15 9 3 -3 -5 http://www.paper.edu.cn 1 0 0 0 0 1 1 1 1 则表 3 中的前 2 项为输入因子,输出因子为实际爆发程度,利用上表的学习例子对网络 进行训练,训练前对数据进行归一化处理。 3.1 BP 网络设计 这里采用单阴层的 BP 网络进行病毒爆发程度预测。由于输入的样本为 2 维的输入向量, 因此,输入层有 2 个神经元,则中间层应该有 5 个神经元。网络只有 1 个输出数据,则输出 层只有 1 个神经元。因此,网络应该为 2 5 1   的结构,按照 BP 网络的一般设计原则,中 间层神经元的传递函数为 S 型正切函数。由于输出已被归一化到[0,1]中,因此,输出层神经 元的传递函数可以设定为 S 型对数函数,即可如此创建一个符合要求的 BP 网络。 经过 97 次训练,网络的目标误差达到要求,如图 4: 图 4 训练结果 BP 神经网络训练结束(前 15 个月预测),用 2008 年 12 月,2009 年 1 月的数据进行 测试,误差如下图 5: -4-
中国科技论文在线 http://www.paper.edu.cn 图 5 测试误差情况 由图 5 可知 BP 神经网络模型误差很小,在一定程度上可以用来预测将来的情况。 3.2 BP 神经网络预测 预测 2009 年 2 月到 2010 年 1 月份 H3N2 病毒的爆发值如图 6: 图 6 加拿大未来一年 H3N2 爆发程度预测值 3.3 BP 神经网络模型的检验 由加拿大 2009 年 2 月到 2009 年 4 月的情况[6]进一步检验模型是否合理,如图 7 所示: -5-
中国科技论文在线 http://www.paper.edu.cn 图 7 2009 年 2 月到 4 月加拿大实际流感发病情况 对照图 6 与图 7,可以看到已有实际情况(2009 年 2 月到 4 月)与预测值符合较好,在 2009 年 2 月和 3 月加拿大确实经历了流感病毒广泛爆发,在 3 月到 4 月,情况逐步好转, 病毒爆发程度经地区性爆发水平降至地方性爆发水平,与预测图相符。经过对比,其他国家 的病毒爆发程度在 2009 年 2 月到 4 月与对应预测图也较符合。 4 结论 然后对经过初次筛选后的其他 H3 病毒疑似国家或地区(以及对所有 H1、B 病毒疑似 国家或地区)进行同样的预测,在满足测试值良好的数据下对未来进行预测。并分别按照该 病毒预期爆发程度最大值(可以认为最有威胁的病毒品种是有最强爆发程度的品种)及月平 均值降序(可以认为最有威胁的病毒品种是有累积较强爆发程度的品种)进行排列,以此得 到各病毒具体品种的威胁程度。结果如下 表 4 H3 疑似国家或地区预测爆发程度排序 国家 加拿大 美国 俄罗斯 挪威 日本 荷兰 中国香港地区 突尼斯 阿根廷 巴西 葡萄牙 西班牙 H3 最大值 26.9996 26.8078 26.7686 13.4999 13.4921 8.9999 8.9857 8.9741 8.9666 4.9997 4.5004 3.1663 国家 加拿大 美国 俄罗斯 中国香港地区 巴西 挪威 日本 荷兰 突尼斯 中国 菲律宾 阿根廷 -6- H3 平均值 19.1253 6.1775 3.7504 3.3337 3.0662 2.3335 2.2116 2.1135 1.8051 1.4871 1.3752 1.251
中国科技论文在线 http://www.paper.edu.cn 厄瓜多尔 菲律宾 韩国 中国 英国 马达加斯加 泰国 肯尼亚 澳大利亚 新西兰 马提尼克岛 印度 墨西哥 埃及 新加坡 智利 瑞典 哥斯达黎加 国家 俄罗斯 日本 挪威 美国 加拿大 智利 中国香港地区 荷兰 突尼斯 葡萄牙 阿根廷 巴西 西班牙 英国 中国 韩国 菲律宾 马达加斯加 墨西哥 澳大利亚 厄瓜多尔 肯尼亚 印度 瑞典 新加坡 泰国 2.9999 2.9973 2.9879 2.9708 2.2 1.4966 1 0.9998 0.9996 0.9934 0.6 0.5 0.5 0.4993 0.4546 0.3791 0.3579 0.0549 厄瓜多尔 葡萄牙 英国 韩国 泰国 西班牙 肯尼亚 马达加斯加 新加坡 新西兰 澳大利亚 马提尼克岛 埃及 瑞典 智利 印度 墨西哥 哥斯达黎加 表 5 H1 疑似国家或地区预测爆发程度排序 国家 日本 加拿大 美国 俄罗斯 挪威 巴西 中国香港地区 荷兰 智利 突尼斯 中国 英国 葡萄牙 阿根廷 马达加斯加 韩国 泰国 西班牙 新加坡 厄瓜多尔 澳大利亚 墨西哥 菲律宾 瑞典 肯尼亚 印度 H1 最大值 26.9837 26.7663 25.5895 13.0004 11.3334 8.9951 8.9884 8.986 8.8773 5.0004 4.9999 4.9997 4.7488 2.9997 2.9995 2.9957 2.0001 1.9972 1.6666 1 1 0.9995 0.9966 0.9965 0.9863 0.9781 -7- 0.8941 0.8766 0.6631 0.6108 0.5553 0.5309 0.5274 0.4264 0.4179 0.2083 0.2069 0.151 0.1021 0.0719 0.0507 0.0417 0.0417 0.0083 H1 平均值 6.0257 4.8976 4.2343 4.2023 3.3393 3.0662 2.7056 1.9087 1.7105 1.5475 1.3899 1.2089 1.2003 1.1813 1.1331 0.9163 0.8395 0.8022 0.7356 0.62 0.5852 0.5305 0.4688 0.4327 0.4257 0.3126
中国科技论文在线 http://www.paper.edu.cn 马提尼克岛 新西兰 哥斯达黎加 埃及 摩洛哥 0.75 0.6667 0.5 0.4997 0.0524 新西兰 埃及 马提尼克岛 哥斯达黎加 摩洛哥 表 6 B 疑似国家或地区预测爆发程度排序 中国香港地区 国家 日本 巴西 俄罗斯 挪威 加拿大 美国 智利 英国 葡萄牙 荷兰 突尼斯 西班牙 阿根廷 墨西哥 马达加斯加 厄瓜多尔 中国 菲律宾 马提尼克岛 韩国 瑞典 肯尼亚 澳大利亚 印度 新西兰 哥斯达黎加 埃及 新加坡 泰国 B 最大值 26.9988 26.9632 26.9311 26.8609 26.7765 26.7661 9 9 9 8.9999 8.9905 8.9671 8.8529 5.999 2.9968 2.9764 2.3572 1.6668 1.6666 1.5 1.0371 1 0.9999 0.9999 0.9994 0.9984 0.5714 0.5555 0.5 0.359 国家 巴西 挪威 美国 英国 加拿大 日本 智利 俄罗斯 葡萄牙 中国香港地区 西班牙 荷兰 厄瓜多尔 突尼斯 阿根廷 墨西哥 马达加斯加 马提尼克岛 菲律宾 肯尼亚 印度 瑞典 中国 新加坡 泰国 新西兰 韩国 澳大利亚 哥斯达黎加 埃及 0.1949 0.1913 0.1885 0.1515 0.0071 B 平均值 7.1243 6.9801 6.2026 5.9972 5.9909 5.7262 5.1279 5.1069 3.9984 2.6944 2.3783 2.1135 1.7713 1.749 1.1717 1.1686 1.0783 0.925 0.7588 0.5897 0.5693 0.5257 0.4641 0.4242 0.3271 0.2606 0.2564 0.2411 0.2384 0.1261 表 7 基于地理划分的各流感区域预期流感较严重国家或地区 北 非 西 亚 东亚 南 亚 东南 亚 俄 罗 斯 中 亚 大洋洲 非洲南 部 欧洲 西部 北美 南 美 西 南美 东 中美 -8-
分享到:
收藏