这里我用 PASW Statistics 18 软件,大家可能觉得没见过这个软件,其实就是 SPSS18.0,
不过现在 SPSS 已经把产品名称改称为 PASW 了!
我们通过案例来说明:(本案例并不想细致解释预测模型的预测的假设检验问题,1-太复杂、
2-相信软件)
假设我们拿到一个时间序列数据集:某男装生产线销售额。一个产品分类销售公司会根据过
去 10 年的销售数据来预测其男装生产线的月销售情况。
现在我们得到了 10 年 120 个历史销售数据,理论上讲,历史数据越多预测越稳定,一般也
要 24 个历史数据才行!
大家看到,原则上讲数据中没有时间变量,实际上也不需要时间变量,但你必须知道时间的
起点和时间间隔。
当我们现在预测方法创建模型时,记住:一定要先定义数据的时间序列和标记!
这时候你要决定你的时间序列数据的开始时间,时间间隔,周期!在我们这个案例中,你要
决定季度是否是你考虑周期性或季节性的影响因素,软件能够侦测到你的数据的季节性变化
因子。
定义了时间序列的时间标记后,数据集自动生成四个新的变量:YEAR、QUARTER、MONTH 和
DATE(时间标签)。
接下来:为了帮我们找到适当的模型,最好先绘制时间序列。时间序列的可视化检查通常可
以很好地指导并帮助我们进行选择。另外,我们需要弄清以下几点:
• 此序列是否存在整体趋势?如果是,趋势是显示持续存在还是显示将随时间而消逝?
• 此序列是否显示季节变化?如果是,那么这种季节的波动是随时间而加剧还是持续稳定
存在?
这时候我们就可以看到时间序列图了!
我们看到:此序列显示整体上升趋势,即序列值随时间而增加。上升趋势似乎将持续,即为
线性趋势。此序列还有一个明显的季节特征,即年度高点在十二月。季节变化显示随上升序
列而增长的趋势,表明是乘法季节模型而不是加法季节模型。
此时,我们对时间序列的特征有了大致的了解,便可以开始尝试构建预测模型。时间序列预
测模型的建立是一个不断尝试和选择的过程。
PASW Statistics 提供了三大类预测方法:1-专家建模器,2-指数平滑法,3-ARIMA
指数平滑法
指数平滑法有助于预测存在趋势和/或季节的序列,此处数据同时体现上述两种特征。创建
最适当的指数平滑模型包括确定模型类型(此模型是否需要包含趋势和/或季节),然后获
取最适合选定模型的参数。
1-简单模型预测(即无趋势也无季节)
首先我们采用最为简单的建模方法,就是简单模型,这里我们不断尝试的目的是让大家熟悉
各种预测模型,了解模型在什么时候不适合数据,这是成功构建模型的基本技巧。我们先不
讨论模型的检验,只是直观的看一下预测模型的拟合情况,最后我们确定了预测模型后我们
再讨论检验和预测值。
从图中我们看到,虽然简单模型确实显示了渐进的上升趋势,但并不是我们期望的结果,既
没有考虑季节性变化,也没有周期性呈现,直观的讲基本上与线性预测没有差异。所以我们
拒绝此模型。
2-Holt 线性趋势预测
Holt 线性指数平滑法,一般选择:针对等级的平滑系数 lapha=0.1,针对趋势的平滑系数
gamma=0.2;
从上面的拟合情况看,Holt 预测模型更平滑了,也就是说 Holt 模型比简单模型显现了更强
的平滑趋势,但未考虑季节因素,还是不理想,所以还应放弃此模型。
3-简单季节性模型
当我们考虑了季节性变化后,简单季节性预测模型基本上较好的拟合了数据的大趋势,也就
是考虑了趋势和季节。
4-Winters 相乘法预测模型
我们再次选择 Winters 预测模型,实际上这时候非统计专业人士其实已经可以不用考虑
Winters 模型的原理了,因为对于大部分经营分析人员,如果期望把每一个预测方式的细节
都搞清楚,并不容易,也容易陷入数量层面的纠葛中,我们只要相信软件算法就可以了。
此时,在数据集的时间跨度为 10 年,并且包含 10 个季节峰值(出现在每年十二月份)中,
简单季节模型和 Winters 模型都扑捉到了这 10 个峰值与实际数据中的 10 个年度峰值完全匹
配的预测结果。此时,我们基本上可以得到了一个比较满意的预测结果。
此时也说明,无论采用指数平滑的什么模型,只要考虑了季节因素,都可以得到较好结果,
不同的季节性指数平滑方法只是细微差异了。
但是,我们仔细看预测值和拟合值,还是有一些上升和下降的趋势和结构没有扑捉到。预测
还有改进的需求!
5-ARIMA 预测模型
ARIMA 模型是自回归 AR 和移动平均 MA 加上差分考虑,但 ARIMA 模型就比较复杂了,对大部
分经营分析人员来讲,要搞清楚原理和方程公式,太困难了!期望搞清楚的人必须学过随机
过程,什么平稳过程、白噪声等,大部分人头都大了,现在有了软件就不问为什么了,只要
知道什么数据 In,什么结果 Out,就可以了。