哈尔滨工程大学硕士学位论文基于贝叶斯网络的动态预测模型研究及其应用姓名:马栩申请学位级别:硕士专业:计算机软件与理论指导教师:吴良杰2012-03
基于贝叶斯网络的动态预测模型研究及其应用摘要博弈是与现实中的竞争相对应的数学理论,近年来在人工智能方面有广泛的应用,非完全信息博弈是其中不确定性最大的情况,也是最值得研究的内容,像机器人足球赛,和计算机对弈,模拟现实场景等等,在这方面的应用对现实的指导意义是明显重要的。贝叶斯推理是一种以概率分布为基础的推理方法,它结合了贝叶斯理论的图模型,通过进行一些条件独立性假设,将复杂的问题进行简化处理,进而把事件之间的相互影响关系用图的形式表达出来,然后利用概率理论中的先验概率和后验概率进行推理求解。贝叶斯方法的多种特点和优点都使得其不仅为应用其理论解决概率相关问题(如分类聚类),还可以用其图模型解决策略选择的问题(如推理和识别)。然而贝叶斯推理方法应用到博弈中时还存在着一些问题和可扩展之处,为了弥补这些问题、补充可扩展之处,我们将引入一个在模拟现实方面有良好前景的领域,即多智能体系统(MAS,Multi—AgentSystem)。这样我就可以把动态预测模型与代表具有智能实体的agent相结合,同时把MAS系统中的调度算法与贝叶斯方法相结合,使其预测能力充分发挥。本文就是综合考虑了模拟现实博弈的良好应用前景和贝叶斯推断理论的良好性能,旨在设计一个应用于非完全信息博弈状态下的动态预测模型,并且使其更具普适性,更好的与现实相映射。本文的主要工作:(1)提出了动态预测的模型架构。针对贝叶斯方法缺乏对周围环境中常变因素的考虑,将其应用到非完全信息博弈的MAS中,运用感知agent的构造理论,与agent相结合构成总体框架。(2)运用了改进的学习算法。通过对贝叶斯方法的深入研究,发现由于贝叶斯方法构成的学习网基本是固定的,即使是动态贝叶斯方法也只是在最初建立好学习网后,随时间推移,前一时刻的因素对后一时刻的本学习网中已经形成制约关系的因素的影响,就很难考虑到博弈的对象的变化及其变化给贝叶斯学习网带来的影响,不能及时更新学习网。于是将K2算法和相关性算法相结合,构成一种准确的学习算法。该算法简单可行,而且准确性高。充分考虑了条件独立假设,增强学习准确性的同时也不至于在时间上有很大消耗。(3)提出了对预测准确性的判断方法。在预测过程中没有对预测结果的评价,也就是说
哈尔滨工程大学硕士学位论文没有办法知道预测结果是否准确,并且根据结果是否准确做出调整。贝叶斯方法不管是静态的方法还是动态的方法,都没有一个很好的反馈,使其在动态变化的环境中表现不是很出色,所以在预测的结果后要对结果进行一个判断,引入预测误差的概念来做为判断的依据。(4)在贝叶斯预测的过程中添加了对环境因素的感知等级概念。贝叶斯方法中没能按照急需的主次顺序来进行推理,也就是不能及时找出最需要推理的因素,没有办法使该因素及时地得到预测值,会使推理失去意义,不能实时、有效地抓住影响自身的主要因素,给出的策略会造成避重就轻。在本文中加入感知等级的概念就是用来解决这个问题。引入该概念则可以解决该问题。关键词:动态预测;动态贝叶斯网络;感知agent;感知调度;
AbstractGameTheoryisamathematicaltheorythatcorrespondstheconceptofcompetitioninthereality,andrecentlyearnsawideapplicationinthefieldsofAI(artificialintelligence).Incompleteinforma.tiongameisoneofthelargestuncertaincase,andthemostworthytostudy.ThesignificanceofthesimulmionforthisrespectofAIisobviouslyimportant.Bayesianpredictionisareasoningapproach,basedonprobabilitydistribution,inwhichcombinethegraphmodeloftheBayesiantheory,andthroughconditionalindependenceassumption,simplif-Ycomplexissuestoshowtheinteractionbetweentheincidentsthataffecteachotherwithamap,fi.nallycalculatethepriorprobabilityandposteriorprobabilitytosolvetheproblem.ThefeaturesandbenefitsofBayesianmethodsmakeitnotonlytosolveproblemsrelatedtoprobabilitytheory(suchasclassificationclustering),butalsotoapplythegraphmodelforstrategyselectionproblems(suchasreasoningandrecognition).However,whenBayesianpredictionisappliedtothegametheoryitshowssomeproblemsandi—ssuestobeextended.Inordertocompensateforthese,weinlroduceMAS(Multi.AgentSystem),thathasagoodprospectinthefuture.AndSOwecancombinethedynamicpredictionmodelandt..heagentwhichpresentstheentitywithintelligencetosufficientlypredictthefuture.AfterintegrallyconsideringthegoodprospectinsimulatedrealityandthegoodperformanceofBayesianmethods,wedesignadynamicpredictionmodelinthestateofincompleteinformationg.ame,tomakeitmoreuniversalandbettermapwithreality.Themainjobsofthisdissertation:(1)Constructadynamicpredictionmodelstructure.AsforthelackofconsideringtheuncertainfactorsofthesurroundingenvironmentthroughBayesianmethods,wemakeitsapplicationtotheMASinincompleteinformationgamebytheuseofagentstructuretheoryofperception,andthenconstitutethewholeframeworkcombinedwithagent.(2)Executeanimprovedlearningalgorithm.ThroughdeeplyresearchonBayesianmethods,wefindthataBayesianlearningnetworkisbasicallyaptotic.EvenforBayesianlearningnetworkafterexecutingthedynamicBayesianmethods,becauseofthefixedrelationshipbetweenthepreviousf-
哈尔滨工程大学硕士学位论文actorsandthelatterfactorsintime,it'sdifficulttoupdatethewholenetwork.SocombinetheK2a-lgorithmandtherelatedalgorithmstoformanaccuratelearningalgorithm.Thealgorithmissimple,feasible,andhighaccurate.Fullaccountoftheconditionalindependenceassumption,enhancethelearningaccuracywhileconsumingintimeaslittleaspossible.(3)Advanceamethodtojudgetheaccuracyofprediction.Duringtheprediction,thereisnovalu。ationofthepredictionresultstoknowwhethertheresultsareaccurate,andCan’tadjustthepredicti_onmethod.AstoBayesianmethod,nomatterdynamicwayornot,thereisnogoodfeedback,SOt。hattheperformanceofthedynamicpredictionresultsisnotverygood.Sointroducetheconceptofpredictionerrortojudgethepredictionresultstomakethemethodchangingitselfthoughit·(4)IntroducetheconceptofperceptionrankintheprocessofBayesianprediction.ThereisnoP。rimaryandsecondaryreasoninginBayesianmethod,SOitcan’tidentifytheincidentthatmostneedtobepredicted.Inthiscase,itcan’tpredictintimeandsufficiently.Sowecanusetheranktosolvetheproblem.Keywords:dynamicprediction;dynamicBayesiannetwork;perceptionagent;perceptionscheduling;
第1章绪论第1章绪论1.1研究背景及意义人工智能(ArtificialIntelligence,简称AI)是计算机领域里的一个分支,是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学[231。二十世纪七十年代以来被称为世界三大尖端技术之一(空间技术、能源技术、人工智能);也被认为是二十一世纪(基因工程、纳米科学、人工智能)三大尖端技术之一。人工智能从诞生开始到现在的几十年间,随着计算机软硬件技术的迅猛发展,使其相关技术在多个学科领域也取得了迅速发展,得到了广泛的应用,也为其他学科领域的研究取得了大量丰厚的成果。它试图探索智能的本质,并研制出一种模仿人类行为方式的全新智能机器。该领域的研究内容包括机器人、语言识别、图像识别、自然语言处理和专家系统等。总而言之,人工通知产生的目的就是要让机器能够具有人类的能力,然后作为人类的帮手去帮助人们完成一些复杂、麻烦、重复或危险的工作。人类的智能在动态变化的环境中体现的尤为明显,人能感觉到环境的变化,并且从中发现、总结知识和规律,从而对未来事态的发展做出相应的判断,使其对自身有利,并且不断循环更新自己的知识。正如在人类的竞争环境中,人与人之间的博弈正是这种智能的良好的体现。博弈(gameplaying)是应用数学领域的分支,是指多个具有决策能力的主体彼此影响,并在过程中各主体通过体收集、学习信息,对自身、其他主体的能力进行感知,预测出对自身有利的策略,做出以上行为一个过程。博弈分为静态博弈和动态博弈。静态博弈指的是在博弈过程中,各个主体的行或者同时或者有先后的顺序,但是互相之间不知道彼此的行动策略;动态博弈指的是在博弈过程中,各个主体的行为也是有先后的顺序,但后者知道前者的行动策略。在此基础上,如果按照主体问相互影响的效果,即协作或竞争来分,可分为合作性博弈和非合作性博弈,就目前的研究状况来说,国内外的专家更多的是将研究内容指向非合作性博弈。合作性博弈指的是各个主体都会考虑自身的收益,并且与其他的主体协作以达到共同收益的目的;非合作性博弈指的是各个主体考虑自身收益的时候,不考虑其他主体的收益或
哈尔滨工程大学硕士学位论文以牺牲其他主体的收益为代价来获取自身的收益。明显的是合作博弈是在总体资源充足的情况下可以让大家都收益的情形,而在资源短缺的情况是会发生非合作博弈。再从对已有知识的了解情况来说,博弈又可分为完全信息博弈和不完全信息博弈【251。完全信息博弈指的是各个主体对周围的环境,包括其他主体的信息是完全了解的;相反的就是非完全信息博弈。严格来说,完全信息博弈是指这样一种博弈:各个主体的策略或策略组合,是博弈中所有主体共同的信息。而不完全信息博弈,各个主体所要达到的目标使自身的收益最大化。综上所述,博弈在应用的环节主要分为如下四类:完全信息静态博弈、完全信息动态博弈、不完全信息静态博弈、不完全信息动态博弈。其中策略性博弈应属于完全信息静态博弈,而完全信息动态博弈则包括扩展性博弈和重复博弈等;不完全信息静态博弈则是以贝叶斯均衡等理论完成对混合策略的重新解释,不完全信息动态博弈则是完美贝叶斯均衡为核心概念的信号博弈。本文的研究内容就是在随时间变化的非完全信息动态博弈环境下,让处在环境中的个体感知环境的变化,可以及时更新知识,并根据所学习的知识对未来做出相应准确的判断。就本文所研究的环境来说,对于建立在概率统计顾上的知识发现方法方面,贝叶斯方法有着明显的优势,是表示和求解非完全信息的最佳模型。用先验概率、后验概率、条件概率分布来表达随机事件发生的可能程度,是其最大的特点。与解决同类型问题的决策树、神经网络、基于事例等方法比较起来,该方法具有如下的优点:(1)在不完全信息状态下,也能有效的解决问题:(2)用于因果推理的同时还可以和其他方法融合;(3)把先验概率和后验概率与已有数据相结合;(4)从算法处理上解决了过度拟合的问题。贝叶斯网络是在已有训练数据基础上构建学习网,然后根据所构造好的学习网来对未来的随机事件做出预测,与此同时也会更新该学习网。在语音识别、生物信息分析、自动化控制、风险投资等多个领域得到应用和证实。一个非完全信息动态博弈的环境,是可以用多智能体系统来实现的,多智能体系统(MAS,Multi.AgentSystem)是分布式人工智能(DAI,DistributedArtificialIntelligence)的一个重要分支,旨在研究用软件实现智能行为的领域,这正符合了本文所要寻找的环境。这样应用MAS理念搭建好预测的环境,同时可以构造其中所需感知的信息和资源,并且运
第1覃绪论用调度来更好地为调用贝叶斯推断理论做好准备工作。综上所述,本文旨在建立一种可以感知周围不断变化的环境,合理调度信息资源,并采用贝叶斯理论发现和利用知识进行预测的动态模型,使其能在人工智能或相关领域得到良好的应用。1.2动态预测模型的发展及现状早在1997年,Syversont61就提出应使用随机博弈来对网络中的正常节点和恶意节点进行理性分析的想法。2002年,LyetM】使用随机博弈形式化定义:和实现了Syverson的想法,并给出一个应用在企业网络中的例子,分析了企业和攻击者双方进行博弈时的纳什均衡和各自的最优行动。2003年,Xu【22]使用基于完全信息的静态博弈设计和分析他们提出的DDoS防御系统,并说明正是由于引入了博弈论使得DDoS防御系统性能得到了优化。他们的研究在不同程度上含有对攻击历史行为分析的倾向,但还不是很明确。2005年,Liu和Zang【31耶:】关于入侵意图的攻击预测模型的研究为这个领域的进一步发展做出了贡献,将攻击历史行为的关联分析作为一个独立的因素提了出来。而在预测模型发展的过程中,一个对其有重要的作用的理论也逐渐开始与之相结合。从英国学者贝叶斯(ReverendThomasBayes)于1763年在皇家学会学报上发表的论文《论机会学说中一个问题的求解》(Anessaytowardsolvingaprobleminthedoctrineofchances),在该论文中提出了从二项分布的观察值出发对其参数进行概率推断的方法,到20世纪50年代,随着统计学的相关理论被广大国内外专家研究,提出了很多的创新和应用,使贝叶斯理论也受到了欢迎,并得到了迅速发展。尤其对于推理预测问题而言,该理论在应用中占有越来越重要的地位,其从主观性出发的特点更与人工智能的仿人类智能相似,主体可以利用先验概率和后验概率进行分析判断,这是至关重要的。再到20世纪70年代Rubin证明了在某些一般公认的前提下,任何一种最优准则下的解必然是某个先验分布下的贝叶斯解。这一理论使贝叶斯理论可以应用到任何需要求解因果推理问题的领域,使贝叶斯方法在实际的应用中取得了成功,最终该理论使传统的统计学要借助其帮助才能解决一些问题,如Mimnax解和容许问题等等。这为如今贝叶斯方法的广泛应用又提升了一个台阶。贝叶斯方法容易理解,实现简单,并且到现在发展到动态贝叶斯方法后可能随着学习的不断深入,对自身的架构进行不断更正,这给其应用带来极大的实用性。目前,著名的搜索引擎Google所用的搜索算法就是利用贝叶斯方法实现的,此外还有很多著名企业的产品如微软的NotificationPlatform,不仅应用贝叶斯的理论方法还要将其应用到未来的三网融合中,