第十四章 非平稳时间序列模型
平稳时间序列的均值为常数,自协方差函数与起点无关,而非平稳时间序列则不满足这
两条要求。对于非平稳时序的分析处理,基本思路是考虑如何转化到平稳时序,或者如何与
平稳时序联系起来。非平稳时序有两个最主要的表现形式,一个是序列带有趋势项,一个是
单位根过程。
对于带有趋势项的时序,处理办法是从序列里减去趋势项,即减去一个函数;对于单位
根过程,处理办法是作序列的差分,即序列自身前后项相减。还有一个办法,就是找到另外
的有共同趋势的时序相减,即减去另外的序列,几个非平稳的时序组合可以变成平稳的。这
样理解时序的平稳化办法,包括理解协稳(Cointegration)过程,应该比较通俗形象。
本章先研究随机游走和单位根过程。不带常数项的单位根过程,最简单的如:
y
t
=
y
t
−1
ε+
t
(14.0.1)
它的均值尽管为常数,可是方差会趋于无穷,不是平稳过程:
2
t
σ
yD
(
E
=
+
+
=
2
ε
t
)
L
)
t
(
ε
1
(14.0.2)
带有常数项的单位根过程:
经反复替代可得:
y
t
=
y
ρμ
+
+
ε
t
,
t
−1
1=ρ (14.0.3)
ty
=
∑∞
i
=
0
(
εμ (14.0.4)
+
)
t
显然有增长趋势。因此研究单位根过程的性质,推广到一般情形,进行假设检验,就十分重
要。
单位根过程的检验十分复杂,难以掌握,同时存在的问题较多。一是统计量转换比较多,
二是使用极限分布,三是使用随机积分,四是分布表比较粗糙。本书作者使用自己提出的统
计量分布函数表的 M—C 算法,避免了这四个问题,容易掌握,自然也比较精确一些。
如果几个单位根过程组合起来变成了平稳过程,那么这几个单位根过程之间就存在协稳
关系。本章详细研究了协稳过程与协稳向量的性质、参数估计与假设检验,包括最小二乘方
法与最大似然方法。由于利用了我们的统计量分布函数表的 M—C 算法,所以处理假设检
验问题比较轻松。不必推导什么极限分布,写出了参数估计的统计量,知道了模型变量的初
始分布,就可以算出统计量的分布函数表,进行假设检验了。
本章还介绍了 ARCH、GARCH、IGARCH、EGARCH、GARCH-M、VGARCH 等自
回归条件异方差模型,它们的一些主要的统计性质以及参数估计和假设检验的一些基本方
法。. ARCH 一类过程在满足一定的约束条件时是稳定过程,它的无条件期望和方差均为常
数,但是它的条件方差却随时间变化,是过去的随机干扰的函数。这种性质使得这一类模型
适合于描述金融证券等随机变量的变化规律。
本章的计算比较复杂,也比较多,需要不断扩展和更新,除了DASC软件光碟之外,读
613
者可以在我们的网站 http://public.whut.edu.cn/slx/ 上找到最新的程序和算例。
本章继续约定时间变量
t
取整数,是离散变量,就不一一申明。
第一节 非平稳时序与单位根过程
一、随机游走与单位根过程
许多经济指标的时序数据不具备平稳时序特征,它们往往带有趋势性,例如 GDP 的增
长、货币供应量的增长、财政支出的增长,等等。描述增长趋势的时间序列,一条途径是序
列表达式里直接带有趋势项,如
y
t
+=
a
bt
+
ρ +
y
−1
t
ε
t
(14.1.1)
其中
,0≠b
|
<ρ 。还有一条途径,序列表达式里并不直接带有趋势项,这就是随机游走
1|
与单位根过程。我们先看不带常数项的随机游走与单位根过程。
设有序列
}{ ty
,对序列数据取一阶差分:
y
=Δ=
x
y
t
如果差分序列
}{ tx
是平稳序列,则称原来的序列
作为一般的情况,我们先看随机游走过程:
t
y
(14.1.2)
t
y
1−−
t
}{ ty
为单位根过程。
(14.1.3)
其中 }{ tε 是白噪声。这个序列可以理解为直线上的随机游走,每一步的位置 都是在前一
−1
ε+
t
=
t
t
ty
y
时刻的位置
1−ty
的基础上随机游走一个量
yE
(
t
)
=
yE
(
0
为一常数, 但它的方差
tε 。它是一个非平稳过程,虽然 的期望
εε
+
1
2
(14.1.4)
ε
t
=
+
+
+
y
)
0
ty
L
yD
(
)
(14.1.5)
是时间t 的函数,不是常数,而且随t 发散到无穷大。对(14.1.3)取差分,显然差分序列是
平稳过程,因此随机游走是单位根过程。
L
0
ε
t
=
=
+
+
=
−
t
t
E
(
ε
1
y
2
)
yE
(
t
2
σ
2
)
随机项更一般的单位根过程是
其中
}{ tu
为一平稳过程, 且
t
y
t
+
uE
(
,0)
=
y
u
= −1
+
t
t
t
uuCov
,
(
γ
=
k
y
u
y
=
−1ρ
yL
y
= t
t
1−
yL
1( ρ
)
−
称为滞后多项式,它的特征方程
− zρ
=
u
=
0
1
t
t
t
t
t
其中
1(
Lρ−
)
(14.1.6)
+ )
kt
(14.1.7)
。如果采用自回归的形式:
∞<
(14.1.8)
(14.1.9)
那么
1=ρ 。引进滞后算子 L ,使得
,则上式成为:
614
有根
=z
1
ρ
。当
1=ρ 时,特征方程有一单位根 1=z ,这就是“单位根过程”名称的由来。
(14.1.5)已经告诉我们,单位根过程不是平稳过程。我们还可以进一步分析单位根过
程参数最小二乘估计的极限性质。对于一阶自回归过程
ρ +
=
y
y
t
−1
ε
t
t
我们考虑其中参数 ρ的最小二乘估计。 若这时 }{ tε 独立同分布,并有
= 2σ
ρ的最小二乘估计:
,利用样本
∞<
构造
,
y
,1 L
Ty
(14.1.10)
( tD ε
)
,
=tE ε
0)
(
ˆρ
T
=
y
y
t
t
1
−
(14.1.11)
T
t
∑
∑
1
=
T
t
1
=
y
2
t
1
−
将(14.1.7)代入分子中的 得
ty
T
∑
t
1
=
ˆ
ρ
T
=
y
t
1
−
y
(
ρ
t
1
−
+
ε
t
)
y
ε
t
1
−
t
y
2
t
1
−
T
∑
t
1
=
}{ tε 独立同分布,与 不相关,故
2
t
1
−
y
T
∑
t
1
=
T
∑
t
1
=
1−ty
=
+
ρ
(14.1.12)
当
当
1|
|
<ρ 时, 是平稳过程。因为
时,∞→T
}{ ty
0
。
Tρˆ 以概率收敛于参数 ρ,所以最小二乘估计是一致估计。根据中心极限定
ˆ(
)
ρρ −T
有正态的极限分布
Cov
ε
t
ty
1
−
=
)
(
,
理,
T
T
ˆ(
)
ρρ
⎯→⎯−
d
T
N
,0(
))
(14.1.13)
1(
2 ρσ
2
−
}{ ty
这里符号
⎯→⎯d
表示依分布收敛。注意极限分布的方差,当
为平稳过程时,
|
方差
2 ρσ −
2
1(
)
为一大于零的正数,
T
的极限分布是一正态分布。但当
1|
<ρ ,
}{ ty
为
ˆ(
)
ρρ −T
T
为零,
t
−1
=tE ε
(
)
+
=
t
t
1
−
单位根过程时,
1=ρ ,方差
)
而是一退化分布。显然二者有本质区别。
要描述带有趋势的经济变量,可以用带常数项的随机游走过程。在时间序列
2 ρσ −
2
ˆ(
)
ρρ −T
1(
的极限分布不再是正态分布,
y
t
=
y
ρμ
+
+
ε
t
(14.1.14)
中,若
0≠μ , 1=ρ , }{ tε 独立同分布,
y
+
μ
的随机游走。直接替代一次得
=
y
t
0
,
2
σε =tD
(
(
+
)
y
t
−
2
+
μμε
+
}{ ty
+
ε
t
ε
t
1
−
)
,则称
是带常数项
,反复替代可
得:
ty
=
∞
∑
i
0
=
(
−+
εμ
t
i
)
(14.1.15)
显然它有增长趋势。
模型(14.1.15)的参数μ和 ρ的最小二乘估计μˆ 和ρˆ 可以联合表示为
615
−
T
⎞
⎟
⎟
⎟
⎟
⎟
⎠
以 2/1T 乘μˆ , 2/3T 乘ρˆ ,可以推得估计的极限分布:
ˆ
μ
⎞
=⎟⎟
ˆ
ρ
⎠
μ
⎞
+⎟⎟
1
⎠
T
∑
t
1
=
T
∑
t
1
=
T
∑
t
1
=
⎛
⎜
⎜
⎜
⎜
⎜
⎝
2
t
1
−
⎛
⎜⎜
⎝
⎛
⎜⎜
⎝
1
−
1
−
y
y
y
t
t
1
⎛
⎜
⎜
⎜
⎜
⎜
⎝
T
∑
εε
t
t
t
1
=
T
∑
y
t
1
=
t
ε
t
1
−
(14.1.16)
⎞
⎟
⎟
⎟
⎟
⎟
⎠
2/1
2/3
T
T
⎛
⎜
⎜
⎝
ˆ(
)
−
μμ
)1ˆ(
−
ρ
d
⎞
⎟
⎯→⎯⎟
⎠
r
,0(
N
2
σ
Q
1
−
)
(14.1.17)
其中矩阵 为一正定的实对称矩阵:
Q
Q
=
1
μ
2μμ
2/
2/
3/
⎞
⎟⎟
⎠
⎛
⎜⎜
⎝
(14.1.18)
由(14.1.2)定义的单位根过程可以推广一般的自回归单位根过程,我们可以从
(AR p
)
序列出发考虑。
(AR p
)
模型的主要表达式如:
y
t
=
ρ
1
y
t
1
−
+
ρ
2
y
t
−
2
+
+
L
ρ
y
ptp
−
+
ε
t
=
p
∑
ρ
j
j
1
=
y
t
−
j
+
ε
t
(14.1.19)
其中 tε 是白噪声,要求实数
,
pρρρ
1 L 使得特征多项式的零点都在单位圆外:
2
,
,
1
−
ρρ
1
2
−
z
2
z
−
p
−
ρ
p
z
L
1
−=
p
∑
ρ
j
j
1
=
j
z
≠
0
,
| ≤z
1|
(14.1.20)
如果取消这一限制,但是假设单位圆
| =z 上只有一个根 1=z ,单位圆内再无其它根,那
1|
么可以将模型重新表达为差分形式。令
ζ
j
−=
(
ρ
j
1
+
+
可将特征多项式改写成
~
ρρρ
=
+
+
1
L ρ
p
L2
j
);
+
+
=
pρ
,2,1
(14.1.21)
,
p
−
1
L
(14.1.22)
1
−
ρρ
1
2
−
L
2
L
−
p
−
pL
ρ
=
L
)~1(
L
ζζρ
2
L
+
−
−
(
1
2
L
+
+
L
相应地可将序列(14.1.19)改写,注意此时它已不是真正意义上的
p
L
−ζ
p
1
(AR p
)
1
−
−
1)(
L
序列:
)
)~1{(
L
ζζρ
2
L
+
−
−
(
1
2
L
+
+
ζ
p
1
−
L
L
p
1
−
1)(
−
yL
)}
=
ε
t
t
重新组织后, 可得
y
~
y
ρ
y
Δ
1
−
根据假设, 特征多项式有且只有一个单位根, 所以当 1=z 时, 有
ζ
Δ+
1
ζ
p
ζ
2
L
1
−
1
−
Δ
+
+
+
=
y
y
−
2
t
t
t
t
上式等价于 1~ =ρ 。
1(
−
ρρ
1
2
−
−
ρ
pL
−
pt
1
+−
+
ε
t
(14.1.23)
0~1)
=
−=
ρ
(14.1.24)
如果对模型(14.1.23)加上常数项μ,可得
~
y
ρμ
+
=
y
t
ζ
Δ+
1
y
t
1
−
+
ζ
2
Δ
y
t
−
2
+
t
1
−
+
ζ
p
Δ
1
−
y
pt
1
+−
+
ε
t
L
(14.1.25)
616
要对ρ~ 作出估计,可令
X
t
=
ζζρμβ
2
Δ
[
=
y
,~,
,
Δ
,1[
y
1
,
,
,
t
1
−
t
1
−
]
′
,
−pζ
1
,
,
L
2
L
y
t
−
(14.1.26)
Δ
y
pt
+−
1
]
′
(14.1.27)
可将(14.1.23)改写成
=
t
给定初始值, 参数β的最小二乘估计 为 βˆ
y
X
εβ+′
t
t
(14.1.28)
T
⎛
∑
⎜
⎜
⎝
t
1
=
它的第二个分量就是参数ρ~ 的估计。
ˆβ
=
XX
t
′
t
−
1
⎞
⎟
⎟
⎠
⎛
⎜
⎜
⎝
T
∑
t
1
=
yX
t
t
⎞
⎟
⎟
⎠
(14.1.29)
有了参数估计的统计量,又知道原始模型的随机分布,我们可以作出 1~ =ρ 的假设检验。
下面我们进一步研究多维时序的单位根过程。在第十三章我们已经建立起 m 维随机向
量 阶自回归过程:
p
r
X
t
=
m
其中 }{ tεr 是 元白噪声
的根都在单位圆外时:
2
W σ
,0(
mI
)
,
j
t
r
XΡ
p
∑
j
1
=
PP
, 2
,
1 L
,
− +
j
εr
t
(14.1.30)
pP
是
mm× 实矩阵。当序列的特征方程
det
I
m
⎛
⎜
⎜
⎝
p
− ∑
j
1
=
j
zP
j
⎞
⎟
⎟
⎠
≠
,0
z
≤
1
(14.1.31)
VAR p 模型有其平稳解,即将序列表为白噪声的叠加:
)
(
现在我们讨论将序列表为差分形式。带常数项的自回归序列也可等价地表示为
r
tX
r
μ
+=
∑∞
j
=
0
Φ
r
ε
t
j
−
j
(14.1.32)
I
(
其中的 L 为滞后算子。令
−
2
LΡLΡ
1
2
−
−
n
−
L
r
XLΡ
)
p
p
=
εμ r
r
t
+
t
(14.1.33)
~
ΡΡ
1
=
+
~
ζ
s
[
−=
P
s
+
1
+
+
+
Ρ
L2
P
s
+
+
2
L
pΡ
P
+
p
(14.1.34)
]
(14.1.35)
其中
s
=
,2,1
,
p
−
1
。利用上述记号可将多元时序(14.1.32)表示成下列形式:
L
−
[
I
=
[(
=
−
2
LPLP
−
−
1
2
L
~
~(
)~
LP
L
ζζ
1
2
~
~
r
XP
X
Δ−
ζ
1
1
−
+
−
t
t
−
−
n
I
n
r
X
t
2
L
−
1
−
p
r
XLP
p
]
t
~
+
+
−ζ
p
1
L
~
r
X
Δ
ζ
2
2
−
t
−
p
1
−
L
−
L
t
−
1)(
~
ζ
p
r
XL
)]
r
X
Δ
1
−
617
pt
1
+−
=
r
r
εμ
t
+
(14.1.36)
从而有
r
X
r
+=
μ
~
r
X
Δ+
ζ
1
若在以上序列中, 随机向量 tXr
~
r
XP
1
−
t
t
~
r
X
Δ+
ζ
2
t
1
−
t
−
2
+
L
~
ζ
p
+
r
X
Δ
1
−
(14.1.37)
的每一个分量都含有单位根,那么,
,即
+
r
ε
t
1
pt
+−
~
nIP =
PP
1
+
+
L2
+
P
p
=
I
n
的估计,那么就可以作出
(14.1.38)
~
nIP =
的假设检验。
同样的,只要我们作出了 P~
二、单位根过程的检验
对于带有增长趋势的经济时间序列数据,单从图像上我们无法确定数据是带趋势项的平
稳过程,还是带常数项的单位根过程,因此需要进行检验。带趋势项的平稳过程,典型的如
(14.1.39)
ρ +
≠ ρ
)1|
<
|,0
b
(
,
+
y
t
−1
ε
t
y
bt
带常数项的单位根过程,典型的如
+
+=
=
a
y
t
y
ρμ
t
+
ε
t
y
=
ρ
0
y
t
t
−1
即数据由
可以从t 分布表中查得相应的临界值 ,若2/αt
。
绝原假设 , 接受备选假设
=ρH
1 : ρρ≠
0
:0
这种方法不能直接用来检验假设
0H
H
Tt
不服从t 分布。
此时参数 ρ的最小二乘估计ρˆ 为:
618
t
−1
+
ε
t
,
(
≠ ρμ
,0
=
)1
(14.1.40)
研究证明,若对带趋势的时序数据进行假设检验,即使数据不是由(14.1.39)产生的, 而
是由带常数项的单位根过程(14.1.40)产生的,我们硬性要将它作为(14.1.39)处理,对线
性趋势项的参数 和 作t 检验,t 统计量仍会呈显著性。这样的检验结果显然是不对的。
因此在检验时间趋势之前,需要先确定在时间序列中是否存在单位根。只有在单位根假设被
拒绝后,才采用模型(14.1.39),并对其中的参数作假设检验。
下面我们具体讨论一个例子。设有平稳的一阶自回归过程
a
b
|
y
t
=tE ε
<ρ , }{ tε 独立同分布,且
(
H
:
1|
)
=
0
,
−1
y
ρ +
ε
t
t
σεtD
(
= 2
:
)
H
1
(14.1.41)
∞<
,检验假设
ρρ
0
↔=
0
ρρ
0
≠
(14.1.42)
其中
t
1
0 <ρ ,检验的 统计量由下式给出:
ˆ
ρρ
0−
ˆ
η
=Tt
(14.1.43)
其中ρˆ 为 ρ的最小二乘估计,ηˆ 为ρˆ 的标准差的估计值。当原假设
H
为真时,
产生,统计量 Tt 有自由度为 1−T 的t 分布。根据显著性水平α,
;否则拒
, 接受原假设
0 : ρρ=
0
tT <
|
αt
2/
H
|
0 : ρρ=
0
1
,因为当假设
=ρH
:0
1
为真时,可以证明
y
y
t
t
1
−
y
2
t
1
−
(14.1.44)
ˆρ
T
∑
t
1
=
= T
∑
t
1
=
有极限
迪基—福勒方法找到统计量
ˆ(
−TT ρ
)1
)1ˆ(
T ρ
→−
2
W
1)1(
−
1
2
∫
dr
rW
)(
0
2
(14.1.45)
其中
)(tW
表示布朗运动。以
ηˆ 表示统计量ρˆ 的标准差的估计值,它有表示形式
2ˆ
ˆ
ση
=
⎛
⎜
⎜
⎝
T
∑
t
1
=
2
ty
1
−
2/1
⎞
⎟
⎟
⎠
(14.1.46)
其中的 为方差 的最小二乘估计:
2σ
2ˆσ
2
ˆ
σ
=
1
−
1
T
∑
t
1
=
T
(
y
t
−
ˆ
ρ
y
2
)
t
1
−
(14.1.47)
由ρˆ 和ηˆ 构造检验原假设的 统计量
Tt
t
T
=
1ˆ
ρ
−
ˆ
η
T
=
⎛−
)1ˆ(
ρ
⎜
⎜
2
ˆ
σ
⎝
1
2
T
T
∑
t
1
=
y
2
t
1
−
2/1
⎞
⎟
⎟
⎠
(14.1.48)
可以推证 的极限为
Tt
tT
→
2
⎧
⎨
⎩
∫
1)1(
−
2
W
1
rW
)(
0
2
dr
2/1
⎫
⎬
⎭
(14.1.49)
迪基—福勒(Dickey-Fuller test)根据这个极限,用随机模拟方法计算出函数表,让用户去
查表检验。有一个算例是检验美国财政部债券 1947 年到 1989 年的季度利息率,168 个数据,
查表用的是样本容量 100 的情况,然后得出检验结果是接受了原假设
=ρH
。
1
:0
参数假设检验问题有几个要点,一是要有原假设,二是要有根据样本计算参数的统计量,
三是要有备择假设,四是要有显著性水平,五是要能够根据统计量和参数假设构造出不含任
何参数的分布,该分布有分布表。能够用函数式表达的分布毕竟是少数。用极限分布去近似
是常用的办法,可惜有的统计量连极限分布也推导不出来,即使有了,遇到小样本问题实在
是太勉强。
单位根过程的假设检验遇到了分布函数表问题,我们不能推导统计量的精确分布,统计
量的极限分布也是随机积分的形式。迪基(Dickey)—福勒(Fuller)的单位根检验法,将
参数估计的原始统计量进行变化,再推导出极限分布,然后采用随机模拟的办法,计算出分
布函数表,供用户检验使用。一般参考书列出的样本容量分为 25、50、100 三个档次,自由
度也固定,显然应用起来相当粗糙。
619
算例 14.1.2 基于统计量的分布函数表计算
本书作者在 1993 年研究了统计量的概率分布函数表的 Monte-Carlo 算法,基本思想是,
只要有了统计量的表达式,有了样本的分布,就可以大量发生样本的伪随机数,从而得到大
量的统计量随机数;根据统计量随机数构造经验分布函数,就有了统计量的分布函数表。在
这个过程中,需要解决伪随机数的周期限制问题,可以使用一个随机数发生器去打乱若干个
随机数发生器的办法;需要确认统计数表的有效数字位数,可以采取扩大样本容量一倍,统
计数表不变的数字认同为有效数字;当然,也可以采用数据平滑、插值的办法,改进数表精
度。
我们掌握了根据统计量和随机变量的初始分布直接模拟计算统计数表的方法,就可以根
据实际问题自由地计算出需要的分位点或者概率。本书不附任何统计数表,因为我们有
DASC 的电子统计数表。
0y
算出ρˆ 的分布。在模型中任取序列初值 ,不妨令
本书作者的办法避免了极限分布和随机积分,根据模型假设和ρˆ 的估计式可以直接计
,再给发生伪随机数 tε 的种子初
,从而根据(14.1.44)计算出
ρˆ 。继续重复这个计算,只是改变伪随机数 tε 的种子值 ,就能得到 10000 个至 100000
或者其它的假设。
1
}{ ty
tI
ρˆ ,它们是随机的,就形成了分布,就可以用来检验原假设
值 ,就可以根据(14.1.41)得到一个容量为
0 =y
T 的序列
tI
一个
个
=ρH
:0
1
我们提倡的办法优点在于,一是公式转弯少,使用的是原假设的统计量;二是根据统
计量直接的分布,而不是极限的分布;三是不必进行随机积分;四是可以根据任意的显著性
水平、任意的样本容量进行检验,因此更加合理和精确一些。编程也不困难,DASC 软件已
经实现了这一检验。
迪基—福勒检验法讨论原假设和备择假设情况时,将几个参数的情况同时讨论,也比
较复杂,难以掌握。我们建议一个一个地检验,既简单,又避免了滥竽充数的现象发生。迪
基—福勒检验法的详细讨论见 Hamilton 的《Time Series Analysis》。
三、非平稳过程平稳化
在第十二章,我们研究了含有趋势项和周期项的非平稳过程,使用回归的办法找到趋
势项和周期项,从序列里减去它们,可以实现序列的平稳化。这个办法可以理解为从序列里
减去一个函数。
现在我们研究了单位根过程。单位根过程也能使序列呈现增长趋势,我们可以使用差
分的办法实现序列的平稳化。这个办法可以理解为序列本身前后项相减。
还要什么办法可以实现非平稳过程的平稳化呢?能够想到的自然是再找一个或几个序
列来,减去它们或者它们的线性组合,就是序列与序列相减。这是我们在下一节要研究的协
稳(协整)过程。
620