《统计软件实验报告》
SPSS 软件的上机实践应用
时间序列分析
数学与统计学学院
一、 实验内容:
时间序列是指一个依时间顺序做成的观察资料的集合。时间序列
分析过程中最常用的方法是:指数平滑、自回归、综合移动平均及季
节分解。
本次实验研究就业理论中的就业人口总量问题。但人口经济的理
论和实践表明,就业总量往往受到许多因素的制约,这些因素之间有
着错综复杂的联系,因此,运用结构性的因果模型分析和预测就业总
量往往是比较困难的。时间序列分析中的自回归求积分移动平均法
(ARIMA)则是一个较好的选择。对于时间序列的短期预测来说,
随机时序 ARIMA 是一种精度较高的模型。
我们已辽宁省历年(1969-2005)从业人员人数为数据基础建立
一个就业总量的预测时间序列模型,通过 spss 建立模型并用此模型来
预测就业总量的未来发展趋势。
二、 实验目的:
1. 准确理解时间序列分析的方法原理
2. 学会实用 SPSS 建立时间序列变量
3. 学会使用 SPSS 绘制时间序列图以反应时间序列的直观特征。
4. 掌握时间序列模型的平稳化方法。
5. 掌握时间序列模型的定阶方法。
6. 学会使用 SPSS 建立时间序列模型与短期预测。
7. 培养运用时间序列分析方法解决身边实际问题的能力。
三、 实验分析:
总体分析:
先对数据进行必要的预处理和观察,直到它变成稳态后再用
SPSS 对数据进行分析。
数据的预处理阶段,将它分为三个步骤:首先,对有缺失值的数
据进行修补,其次将数据资料定义为相应的时间序列,最后对时间序
列数据的平稳性进行计算观察。
数据分析和建模阶段:根据时间序列的特征和分析的要求,选择
恰当的模型进行数据建模和分析。
四、 实验步骤:
SPSS 的数据准备包括数据文件的建立、时间定义和数据期间的
指定。
SPSS 的时间定义功能用来将数据编辑窗口中的一个或多个变量
指定为时间序列变量,并给它们赋予相应的时间标志,具体操作步骤
是:
1. 选择菜单:Date→Define Dates,出现窗口:
单击【ok(确认)】按钮,此时完成时间的定义,SPSS 将在当前数据
编辑窗口中自动生成标志时间的变量。
当数据准备好,为认识数据的变化规律,判断数据是否存在离群点和
缺损值,最直接的观察方法是绘制序列的图像。
2. 选择菜单选项栏中的 Analyze>forecasting>Sequence
Charts,弹出 Sequence Charts 对话框。
单击【ok(确认)】按钮,得到时序图:
观察发现序列没有明显的周期性,为非平稳时间序列。一般而言,
一次差分可以将序列中的线性趋势去掉,二次差分可以将序列中的抛
物线趋势去掉,图中曲线存在线性趋势,用一阶差分运算去除。
3. 选择菜单:Transform>Create Time Series,弹出对话框:
单击【ok(确认)】按钮,此时完成线性成分的去除,SPSS 将在当前
数据编辑窗口中自动生成差分后的新变量 X_1。
数据经过一阶差分后,检验差分序列自相关和偏相关函数是否为截尾
或拖尾,若是则数据已为平稳序列可以进行 ARIMA 建模,否则继续
对数据进行平稳化处理。
4. 选择菜单 Analyze→Time Series→Autoregression。把被解释变
量选择到 Dependent 框中,选择解释变量到 Independent(s)框中。
单击【ok(确认)】按钮,此时生成自相关和偏自相关相关数据。
表中显示的是自相关计算结果,从左向右,依次列出的是:滞后
数、自相关系数值、标准误差、Box-ljung统计量(值、自由度、原
假设成立的概率值)。通过标准误差以及Box-ljung统计量的相伴概
率都可以说该时间序列不是白噪声,是具有自相关性的时间序列,可
以建立ARIMA模型。