logo资料库

决策树及神经网络算法在股票分类预测中的应用.pdf

第1页 / 共60页
第2页 / 共60页
第3页 / 共60页
第4页 / 共60页
第5页 / 共60页
第6页 / 共60页
第7页 / 共60页
第8页 / 共60页
资料共60页,剩余部分请下载后查看
硕士学位论文题目:决策树及神经网络算法在股票分类预测中的应用研究生陶雨雨专业统计学指导教师黄晓莉副教授完成日期2013年10月
杭州电子科技大学硕士学位论文决策树及神经网络算法在股票分类预测中的应用研究生:陶雨雨指导教师:黄晓莉副教授2013年10月
DissertationSubmittedtoHangzhouDianziUniversityfortheDegreeofMasterApplicationofDecisionTreeAndNeuralNetworkinStockClassificationPredictionCandidate:YuyuTaoSupervisor:AssociateProf.XiaoliHuangOctober,2013
杭州电子科技大学学位论文原创性声明和使用授权说明原创性声明本人郑重声明:所呈交的学位论文,是本人在导师的指导下,独立进行研究工作所取得的成果。除文中已经注明引用的内容外,本论文不含任何其他个人或集体已经发表或撰写过的作品或成果。对本文的研究做出重要贡献的个人和集体,均已在文中以明确方式标明。申请学位论文与资料若有不实之处,本人承担一切相关责任。论文作者签名:日期:年月日学位论文使用授权说明本人完全了解杭州电子科技大学关于保留和使用学位论文的规定,即:研究生在校攻读学位期间论文工作的知识产权单位属杭州电子科技大学。本人保证毕业离校后,发表论文或使用论文工作成果时署名单位仍然为杭州电子科技大学。学校有权保留送交论文的复印件,允许查阅和借阅论文;学校可以公布论文的全部或部分内容,可以允许采用影印、缩印或其它复制手段保存论文。(保密论文在解密后遵守此规定)论文作者签名:日期:年月日指导教师签名:日期:年月日
杭州电子科技大学硕士学位论文I摘要股票市场作为市场经济的“晴雨表”反映着我国经济的总体状况,在我国经济发展中起着重要的作用。随着股票市场的发展,越来越多的人选择投资股票。为了可以准确的选择优秀的上市公司进行投资,从中获取可观的收益,这就需要对股票市场上不同的上市公司的综合经营绩效进行准确的分析预测。然而股票市场数据量庞大,是一个非常复杂的系统,利用传统的方法很难对它做出准确的预测。数据挖掘技术是一个从海量的杂乱无章的数据中提取出隐含和潜在的对决策有价值的信息和模式的过程,它可以处理股票市场上规模巨大、繁琐、杂乱无章的数据。本文利用数据挖掘技术中的C5.0决策树、BP神经网络和RBF神经网络三种分类算法以上市公司的综合经营绩效等级为分类标准进行分类预测。本文选取2012年A股市场上200个上市公司为样本,其中50个为A股市场上综合绩效最优的股票,50个为综合绩效最差的股票,另外100个为随机选取的综合绩效一般的股票,其中50个为上证股票,50个为深证股票。以股票的综合绩效等级为输出变量,选取七大类14个有代表性的财务指标作为输入变量,运用SPSSClementine软件,利用C5.0决策树、BP神经网络和RBF神经网络三种分类算法分别建立分类预测模型。在建立模型时,随机选取样本集中80%的数据作为训练样本,用于模型的建立;选取样本集中其余20%的数据作为测试样本,用于模型有效性的检测。模型建立之后,对三种分类方法的预测准确率进行比较可知,C5.0决策树算法得到的对测试样本集的预测准确率最高,运用C5.0决策树更具有参考意义。由三种分类方法给出的重要变量可知,每股收益增长率对上市公司的综合经营绩效影响最大,现金流动负债比和流动比率对上市公司的综合经营绩效影响也较大。利用三种分类预测模型对上市公司的综合经营绩效进行分析,找出优秀的上市公司财务指标所共有的特征,为投资者在股票的投资决策上提供帮助。关键词:数据挖掘,决策树,神经网络,股票市场
杭州电子科技大学硕士学位论文IIABSTRACTWiththedevelopmentofeconomy,thestockmarkethasgonedeepintoChina'smarketeconomyinvariousfields.Thestockmarketisseenasa"barometer"ofmarketeconomy,reflectsacountry'soveralleconomicsituation.Sincethestockmarketplayanimportantroleineconomicactivity,moreandmorepeoplechoosetoinvestinstocks.However,stockmarketisacomplexsystem,itisdifficulttomakeaccuratepredictionswithtraditionalmethods.Inordertomanagethestockmarketbetter,Weurgentlyneedtofindawaytodigoutusefulinformationfrommassivedata,tohelpusfindtherelationshipstheyexistfromalotofstockmarketdata.Withthedevelopmentofdataminingtechnology,peoplefinallyfindsuchatool-dataminingtechnology,itcanhandlethestockmarket’shuge,cumbersomeanddisorganizeddata.Inthispaper,usingC5.0decisiontree,BPneuralnetworkandRBFneuralnetworkalgorithmtoestablishthreecategoriesclassificationmodel.Intheestablishmentofclassificationmodel,choosing200ofChineseA-sharemarketlistedcompanyassamples,selecting14representativefinancialindicatorsofsevencategories,usingSPSSClementinemodelingtools,withthemethodofdecisiontreeclassificationandneuralnetworkclassificationmethodtoestablishclassificationmodel.Inmodeling,select80%ofthesampleasthetrainingsamplesforestablishingmodel;select20%​​oftheremainingsampleasthetestingsamplefortestingtheaccurateofthemodel.Aftermodeling,comparedvariousmodels,thenchoosethebestpredictionmethod.Withtheeventualmodel,analyzecompany'sfinacialconditiontoidentifycommonfinancialfeatureofgoodcompanies,providedassistancesforinvestorsinstockinvestmentdecisions.Keywords:datamining,decisiontree,neuralnetwork,stockmarket
杭州电子科技大学硕士学位论文III目录摘要.................................................................................................................................IABSTRACT..................................................................................................................II第1章绪论..................................................................................................................11.1研究背景及意义.................................................................................................11.2国内外研究现状.................................................................................................21.2.1国外研究现状................................................................................................21.2.2国内研究现状................................................................................................41.3主要研究方法及研究内容.................................................................................51.3.1研究内容.......................................................................................................51.3.2研究方法.......................................................................................................51.3.3研究框架.......................................................................................................51.4本章小结.............................................................................................................6第2章相关理论知识..................................................................................................82.1常用的证券投资分析方法.................................................................................82.1.1基本面分析...................................................................................................82.1.2技术分析.....................................................................................................112.1.3量化分析.....................................................................................................112.2数据挖掘理论...................................................................................................122.2.1数据挖掘方法.............................................................................................122.2.2数据挖掘步骤.............................................................................................132.2.3数据挖掘的分类技术.................................................................................142.3数据挖掘在股票分类预测中的适用性...........................................................152.4本章小结...........................................................................................................15第3章C5.0决策树、BP和RBF神经网络分类算法............................................163.1C5.0决策树算法................................................................................................163.1.1C5.0决策树的生长.....................................................................................163.1.2C5.0对连续属性的处理.............................................................................183.1.3C5.0对缺失数据的处理.............................................................................183.1.4C5.0对生成规则的利用.............................................................................183.1.5C5.0对决策树的修剪.................................................................................183.2神经网络算法...................................................................................................193.2.1人工神经元模型.........................................................................................193.2.2BP神经网络................................................................................................193.2.3RBF神经网络.............................................................................................233.2.4BP神经网络与RBF神经网络异同点......................................................243.3决策树及神经网络算法在股票分类预测的适用性.......................................253.3.1决策树分类预测的适用性.........................................................................253.3.2神经网络分类预测的适用性.....................................................................253.4本章小结...........................................................................................................26第4章C5.0、BP和RBF算法在股票分类预测中的应用.....................................274.1数据的选取与指标的确定...............................................................................274.1.1指标的确定.................................................................................................27
杭州电子科技大学硕士学位论文IV4.1.2数据的选取.................................................................................................284.1.3样本的描述性统计.....................................................................................284.2决策树分类模型的建立...................................................................................304.2.1模型参数设置.............................................................................................304.2.2决策树模型输出及结果分析.....................................................................324.2.3模型的评估.................................................................................................344.3BP神经网络模型的建立..................................................................................354.3.1BP模型参数设置........................................................................................354.3.2BP模型输出及结果分析............................................................................364.3.3模型的评估.................................................................................................374.4RBF神经网络模型的建立................................................................................374.4.1RBF模型参数设置.....................................................................................374.4.2RBF模型输出及结果分析.........................................................................384.4.3模型的评估.................................................................................................394.5C5.0、BP及RBF模型分类结果的分析比较.................................................394.6本章小结...........................................................................................................40第5章结论与展望....................................................................................................41致谢............................................................................................................................43参考文献......................................................................................................................44附录..............................................................................................................................48附录一:研究生期间发表的论文及科研情况......................................................48附录二:样本股票名称及代码..............................................................................49
分享到:
收藏