logo资料库

SVM神经网络的回归预测分析---上证指数开盘指数预测.doc

第1页 / 共16页
第2页 / 共16页
第3页 / 共16页
第4页 / 共16页
第5页 / 共16页
第6页 / 共16页
第7页 / 共16页
第8页 / 共16页
资料共16页,剩余部分请下载后查看
上证指数 增量支持向量回归机 神经网络1.背景介绍
2.常用的上证指数开盘预测方法
2.1 用机器学习的方法
2.2 基于改进QPSO算法优化SVR的上证指数预测
2.3 基于优化BP算法的上证指数预测分析
3.本文用的方法-支持向量机( Support vector machines, SVM)
3.1 基于统计学习理论的支持向量机
3.2 来源于解决分类问题
3.3线性支持向量机的最优分类函数
3.4非线性支持向量机
4.交叉验证
5.基于增量支持向量回归机的预测模型
5.1支持向量机
5.2数据的提取(原始数据)
5.3数据归一化处理
6. 实验结果和分析
6.1 实验结果
6.2 结果分析
7.结论
8.感谢
9.代码
title({firstline;secondline},'Fontsize',12);参考文献
1 摘要 随着越来越多的人加入到股票投资中,有效的股票预测方法就显得尤为重 要。本文结合增量学习思想,利用支持向量回归机对上证综合指数的收盘价进行 预测,并同神经网络方法进行比较分析。实证研究发现,基于增量支持向量回归 机的股价预测模型表现较佳,为股价预测模型研究提供一种新的方法,进而为投 资者提供一定的参考信息。 关键词 上证指数 增量支持向量回归机 神经网络
2 1.背景介绍 准备做什么:SVM 神经网络的回归预测分析---上证指数开盘指数预测 意义:证券市场是金融市场中最具魅力的市场,人们从未放弃过从证券买卖中获取高额 利润。证券市场不仅直接受到投资者信心和行为影响,同时还受到政治、经济、企业状况和 一些重大消息的影响,是一个具有随机性、时变、波动性较大的非线性系统,难以建立精确 的数学模型,多年来,人们一直在寻找有效方法试图对证券市场建立精确的预测。多年来, 许多学者采用传统回归分析和时间序列方法对证券市场进行了预测和分析,通过证券价格的 历史时间序列挖掘其变化趋势。然而这些传统预测方法是假设证券价格是呈线性趋势变化 的,不能反映描述实际证券市场变化特点,预测结果可靠性不高。80 年代以来,神经网络 算法得到了不断发展,由于神经网络具有自组织、自学习能力,不需要考虑数学模型的内部 结构,可以对非线性系统进行无限逼近和拟合,为证券市场预测和分析的深入研究开拓了新 的空间。然而神经网络自身存在难以克服缺陷,如网络结构复杂、过拟合、泛化能力不强等, 证券价格预测结果与期望值之间有一定差距。支持向量机( support vector machines,SVM) 是 一种基于结构风险最小化原则的机器学习方法,较好地解决了非线性、过拟合和局极小等难 题,泛化能力优异,已成功应用于经济预测领域。 2.常用的上证指数开盘预测方法 2.1 用机器学习的方法 研究上证指数预测问题,针对证券指数变化具有随机性、时变、波动性较大等特点,传 统线性预测方法预测精度低等缺陷,支持向量机是一种基于统计学理论和结构风险最小化原 则的机器学习方法。 2.2 基于改进 QPSO 算法优化 SVR 的上证指数预测 研究证券指数预测问题,证券指数变化具有时变性、不确定性、非线性等特点,传统的 线性预测方法无法正确反映证券指数的变化规律,且神经网络存在局部极小值、过拟合、泛 化能力不强等缺陷,预测精度比较低。为了提高证券指数的预测精度,提出了一种利用改进 量子粒子群(QPSO)算法优化 SVR的证券指数预测方法(改进的 QPSO-SVR)。首先 采用改进的 QPSO 算法优化 SVR的参数,然后将优化后的 SVR对证券指数的非线性变化
3 规律进行建模。最后选取 2002 年 10 月 18 日到 2004 年 1 月 9 日上证指数的历史相关数据进 行实验。实验结果表明,采用改进的 QPSO-SVR提高了证券指数的预测精度,减少了预测 误差。预测结果能够为股票投资者提供有价值的参考意见。 2.3 基于优化 BP 算法的上证指数预测分析 上证指数变化是股市投资者重点关注的指标之一。文章基于 BP 神经网络来建立预测模 型,结合遗传算法优化 BP 网络存在的不足,然后通过组合不同的辅助技术指标优化训练样 本,探寻对上证指数预测准确度较高的混合算法。实验结果表明,优化后的混合算法能较好 的预测上证指数未来一段时间的走势变化,为投资者提供决策辅助。 3.本文用的方法-支持向量机( Support vector machines, SVM) 3.1 基于统计学习理论的支持向量机 基于统计学习理论的支持向量机( Support vector machines, SVM) 以其优秀的学习能力 受到广泛的关注。但传统支持向量机在处理大规模二次规划问题时会出现训练时间长、效率 低下等问题。对 SVM 训练算法的最新研究成果进行了综述, 对主要算法进行了比较深入的 分析和比较, 指出了各自的优点及其存在的问题, 并且着重介绍了目前研究的新进展—— 模糊 SVM 和粒度 SVM。接着论述了 SVM 主要的两方面应用——分类和回归。最后给出 了今后 SVM 研究方向的预见。 3.2 来源于解决分类问题 系统随机产生一个超平面,通过训练移动它,直到训练集合中不同的类别正好位于该超 平面的不同侧面。
4 3.3 线性支持向量机的最优分类函数 其中 xi 为训练样本输入; yi 为训练样本相对应的期望输出; αi 为 Lagrange 系数,αi*为使得间隔最大化时αi 取值; b*为分类的阈值;非线性支持向量机。 3.4 非线性支持向量机 线性支持向量机的扩展,采用支持向量机方法(不同于前面讲的多层感知器方法):将 输入向量映射到一个高维的特征向量空间,并在该特征向量空间中构造最优分类面。通过定 义核函数 K(x,xi)来实现转换。 最优分类函数 Sigmoid 函数
5 4.交叉验证 CV 的思想可以在某种意义下得到最优的参数,可以有效地避免过学习和欠学习的状态 的发生,最终对于测试集合的预测得到较理想的准确率。CV 的基本思想是在某种意义下将 原始数据(datatest)进行分组,一部分作为训练集(train set),另一部分作为验证集(validation set)。其方法是首先训练集对分类器进行训练,再利用验证集来测试训练得到的模型。以 得到的准确率作为评价的性能指标。 错误率随着 C 的变化 错误率随着 G 的变化 5.基于增量支持向量回归机的预测模型 5.1 支持向量机 该概念是 Vapnik 等人于 1995 年提出的一种新型机器学习方法。支持向量回归机是在支 持向量分类机的基础上发展而来。基于增量支持向量回归机的股价预测模型主要是将增量学 习引入到支持向量回归机中。增量学习过程是指从随着时间的推移不断地加入到学习中来的 新样本数据中得到新的信息来对原模型进行更新的过程。值得注意的是,若不断地将新训练 样本加入到学习中,又不剔除任何原训练样本,这需要一个巨大的储存空间。故本文引入固 定时间窗来限制实际用于训练的样本数,通过以一定跨度向前移动的时间窗来增加新样本和 剔除旧样本,并以时间窗涵盖的样本数据展开支持向量回归分析。假设时间窗的大小为 w, 移动跨度为 d,则随着时间的推移,用于建模的训练样本集的更新过程如图1所示,其中, T0、T1 和 T2 为不同时期的待测样本集。根据图1,基于增量支持向量回归机的股价预测过 程就是在时间每一次按移动跨度d推进后以所对应的训练集进行回归建模,并对相应的待测 样本集进行预测。此外,本文采用基于交叉验证和网格搜索相结合的参数寻优方法。具体过
6 程如下:设{θq}为初始化的参数集合,通过交叉验证方法计算其中每个参数元素的对应 交叉验证均方误差MSEq,然后通过网格搜索,按交叉验证均方误差最小化原则,寻找最 优参数,即当 MES*=MIN(MES q)时,θ=θ*,此时的θ为最优参数。 5.2 数据的提取(原始数据) 原始数据
7 5.3 数据归一化处理 6. 实验结果和分析 6.1 实验结果
8 6.2 结果分析 利用得到的最佳参数 C 和 G 对 SVM 进行训练,然后对原始数据进行回归预测。运行结 果:均方误差 MES=5.29148e-005,相关系数 R=99.9439%。 通过使用 CV 方法对误差惩罚参 数 C 和高斯核参数 G 的优化,可以很好的对上证开盘指数进行回归预测,达到理想的效果。 7.结论 SVM 具有优良的学习能力和推广能力,能够有效的客服“维数灾难”和“过学习”的 问题,而 SVM 的参数是影响分类精度、回归预测的重要因素,本文指出误差惩罚参数 C 和 高斯核参数 G 对 SVM 性能的影响是至关重要的,并且基于交叉验证的方法。运用多参数网 格搜素法对两个参数进行优化,有效的用于对上证开盘指数的预测。 8.感谢 感谢朱教授对神经网络课程的讲解,让我对神经网络有了更深的理解。 9.代码 function chapter14 tic; close all; clear; clc; format compact; %% 数据的提取和预处理 % 载入测试数据上证指数(1990.12.19-2014.12.31) % 数据是一个 4579*6 的 double 型的矩阵,每一行表示每一天的上证指数 % 6 列分别表示当天上证指数的开盘指数,指数最高值,指数最低值,收盘指数,当日交易量,当
分享到:
收藏