对上证 50 波动性基于 GARCH 簇模型的研究
孙凯,严定琪
http://www.paper.edu.cn
兰州大学数学与统计学院,甘肃兰州(730000)
E-mail:sunk07@lzu.cn
摘 要:条件方差往往作为未来风险的度量,许多金融定量分析都以资产未来的波动作为输
出参数,如 CAPM 定价公式,Black-Scholes 定价公式等,而本文就是以上证50 收盘价为样
本,运用 GARCH EGARCH TGARCH残差服从正态分布和学生 T 分布的模型进行统计拟合,并对
模型的预测能力进行对比,发现 t 分布的 GARCH 模型能更好的预测短期上证 50 收盘价格的
波动性。
关键词:上证 50 ;GARCH 簇模型;ARCH 效应检验;杠杆效应;预测对比
中图分类号:F224.O
1. 引言
上交所于 2004 年初发布上证 50 指数,上证 50 指数从上证 180 指数成分股中选取规模和
成交金额排名靠前的 50 只股票为样本,统计显示,上证 50 指数对上海股票市场流通市值和
成交金额的覆盖率均达到 25%,与上证综指的相关性达到 97%,因此具有较好的市场代表性。
随着上证 50 指数的推出,上证所将构建起一个由上证综指(全市场指数)、上证 180 指数(投
资标尺指数)、上证50 指数(优质大盘指数)组成的三层金字塔型的指数结构。上证50 指数的
推出,具有聚焦市场资金的投资方向、提升基金净值和加快推出股指期货的三大功能。所以
有必要对其深入研究。而目前上证 50 推出 5 年来,国内学者对其价格波动性的研究还较少,
本文主要应用 GARCH 模
中残差服从正态分布和学生 T
分布的模型
2. 模型简介
分别进行建模拟合,并对比了模型的预测能力。
[2] TGARCH 模型
[1] EGARCH 模型
[3]
[4]
2.1.
ARCH 模型
为了更精确的估计异方差模型,Engle 于 1982 年提出了自回归条件异方差模型
[5]
,这是
ts 依赖于他前期的
2
)
) t
2
一种动态的非线性时间序列模型 ,其基本思想是:扰动项的条件方差
a B e ( (
(
a B 为后移算子多项式)的大小,一个自然延伸的 ARCH(p)模型,可以写作
=
xftx
x
(,,,
ttt
=
v
e
s
tt
t
+
=+++
222
saaeaea e
tttttqt q
2
0112
+
=
a B
)
(
2
a
e
t
L
L
+
)
t
1
e
2
2
0
其中
ftx
(,,,
x-
)t
1
- L 为{ }tx 的 Auto-Regressive 模型, 0
a >
0
2
t
ia ‡
ii d
, ,
~
0
tv
N(0,1)。
- 1 -
-
-
-
-
-
-
-
关函数 1 截尾,于是我们建立一个特殊的平方根过程——随机游走模型描述,估计的基本形
式为:
1tx - + te
tx =c
利用最小二乘法估计参数,我们得到如下结果:
http://www.paper.edu.cn
1tx - + te
tx =1.000097
s.e =(
t=10868.50
对数似然值=2474.144 AIC= -4.816250 SC= -4.81145
对残差序列进行进行分析:
) (1)
9.210 -
5
160
140
120
100
80
60
40
20
0
Series: Residuals
Sample 2 1028
Observations 1027
Mean
Median
Maximum
Minimum
Std. Dev.
Skewness
Kurtosis
6.21e-05
0.000258
0.091569
-0.100241
0.021763
-0.222069
5.407697
Jarque-Bera
Probability
256.5044
0.000000
-0.10
-0.05
0.00
0.05
(图 1 上证 50 对数收盘价残差序列的基本统计情况)
(图2 残差自相关函数的Q统计量)
由(图 1)的收益率的的频数图和统计特征,我们发现收益率的分布是右偏的,峰值大
于 3,因此序列具有尖峰后尾性,同时 J-B 统计量的概率为零拒绝原假设(H:序列服从正态分
布),也说明残差序列不是正态分布。 由(图 2)Q(6)、Q(12)分别是 6 期、12 期 Ljung-Box
修正 Q 统计量,由于这两个统计量对应的概率值大于 0.05,在 95%的水平下认为序列是不相关
的。我们再对序列进行平方根检验,确定残差序列的平稳性:
(图3 pp检验)
通过图形初步考虑残差是一个异方差序列,所以我们对平稳性的检验采用 Phillips-perron
检验(简称 pp 检验)从图中第五行,和第六行输出的 Tau 统计量的值和检验 p 值我们可以看
出,p 值小于 5%,从而拒绝原假设,认为序列是一个平稳序列。
下面我们对残差的方差齐次性进行检验:
- 3 -
·
http://www.paper.edu.cn
(图 4 残差平方的相关性检验图)
(图 5 残差分布图)
通过(图 4)对残差的平方的 Ljung-Box 修正 Q 统计量观察我们发现,L-B 统计量的概
率小于 1%从而我们拒绝原假设,认为残差的平方有显著的相关性。而对残差分布图(图 5)
进行观察我们也可以看出序列存在明显的波动率聚类(Volatility cluster)(在开始的时间波
动率较低,而到了后面波动率明显升高) 这说明误差项可能具有条件异方差性。我们对(1
式)进行条件异方差 ARCH LM (拉格朗日乘子)检验,得到滞后 p=3 时的 ARCH LM 检
验结果:
(表1 1 式的ARCH LM检验)
F-statistic
10.98390 Probability 0.000000
Obs*R-squared 32.04570 Probability 0.000001
P 值远远小于 0.05 从而我们拒绝原假设,认为残差序列具有 ARCH 效应,我们还可以进
一步分析残差平方的自相关和偏自相关函数,
(图 6 残差平方的相关性检验图)
发现自相关系数显著不为 0,而且 Q 统计量非常显著,从而进一步得出残差序列存在
ARCH 效应的结论。
- 4 -
3.2. GARCH 模型
http://www.paper.edu.cn
t
我们利用残差服从标准正态分布的 GARCH(1,1)模型重新估计(1)式,得到模型:
=
x
1.000184
tt
=·+
2.16100.0622110.936729
262
se
tt
8.8910 -
x
1
s-
t
7
) (0.01) (0.0094)
s.e.=(
方程中 ARCH 项和 GARCH 项的系数都是统计显著的,并且对数似然函数值有所增加,
+
e
+
2
(2)
1
同时 AIC(赤池信息准则)和 SC(施瓦茨准则)值都变小了,这说明 GARCH(1,1)模型能
更好的拟合数据。我们再对方程进行异方差的 ARCH LM 检验,得到残差序列滞后阶数为
3 的统计结果
(表 2 2 式的 ARCH LM 检验)
F-statistic
Obs*R-squared
0.078255
0.235630
Probability
Probability
0.971776
0.971642
这时我们在 5%的置信水平下接受原假设,认为残差系列不存在 ARCH 效应,说明利用
GARCH(1,1)消除了随机游走模型中的残差序列的条件异方差性,再对残差平方的相关图的
检验结果的分析中我们也发现自相关系数和偏相关系数近似为零,Q 统计量也变得不显著,
这个结果也说明了残差序列不再存在 ARCH 效应。
方差方程式中的 ARCH 项和 GARCH 项的系数之和a b
+ =0.99894< 1 满足参数约束条
件。由于系数之和非常接近 1,表明条件方差收到的冲击是持久的,冲击对未来的预测很重
要,以上模型说明 GARCH(1,1)模型在上证 50 的研究是合适的
t
+
e
+
2
残差服从学生 t 分布的 GARCH 模型如下:
=
x
1.000178
tt
=·+
1.76100.0554920.944411
262
se
tt
1
1.1310 -
x
1
s-
t
6
) (0.013644) (0.013020)
s.e= (
对方程进行异方差的 ARCH LM 检验:
(3)
1
(表 3 3 式的 ARCH LM 检验)
F-statistic
Obs*R-squared
0.039281
0.118292
Probability
Probability
0.989607
0.989555
这时我们在 5%的置信水平下接受原假设,认为服从 t 分布的 GARCH 模型同样很好的
消除了条件异方差性
3.3. TGARCH 模型
对上证 50 指数建立残差服从标准正态分布的 TGARCH 模型如下:
x
tt
+
e
=
x
1
1.000167
t
=·++
2622
see
ttt
2
+
11
s
t
2.66100.0548220.0223230.931517
1.0310 -
s.e= (
同理建立残差服从学生 t 分布的 TGARCH 模型:
x
tt
1.000177
+
e
=
x
6
1
t
)(0.012140)(0.014546) (0.009842)
tI
11
(4)
- 5 -
-
-
·
-
-
-
·
-
-
-
-
-
-
-
·
-
http://www.paper.edu.cn
(5)
tI
11
=
2622
see
ttt
·++
2
1.83100.05545440.0029970.943753
1.1810 -
s
t
6
+
11
) (0.016381) (0.019483) (0.013243)
s.e= (
通过对参数的显著性检验我们发现两个模型中 1g 在 5%的置信水平下显著为零,从而我
们可以得出相等的正负冲击会产生不同的波动效果,但不存在负冲击比正的冲击更容易产生
波动的杠杆效应。
3.4. EGARCH 模型
对上证 50 指数建立残差服从标准正态分布的 EGARCH 模型如下:
x
tt
1.000136
+
e
=
x
1
t
e
+
s
2
t
=-++-
s
ln0.1838680.143111(0.018633)()0.990183ln
1
t
t
1
1
s.e= (0.034116) (0.02743) (0.009782) (0.003489)
对数似然值=2606.600 AIC= -5.066406 SC= -5.042383
同理建立残差服从学生 t 分布的 EGARCH 模型:
x
tt
x
1.000161
+
e
=
1
t
e
t
1
s
t
s
2
t
1
(6)
2
t
=-++-
s
ln0.1343410.120854(0.002549)()0.994271ln
1
t
e
+
s
t
1
e
t
1
s
t
1
s
2
t
1
(7)
s.e= (0.045357) (0.026875) (0.013149) (0.003829)
在两种非对称的 EGARCH 模型中,通过参数的检验我们发现非对称项g 的估计值在 5%
的置信水平下显著为零,从而我们验证了 TGARCH 模型的结论:上证 50 不存在非对称性
的杠杆效应。
(这种不具备非对称性杠杆效应的原因主要可能由于我国股票的交易机制中存在不允
许买空卖空和实行 10%的涨停板机制有关。)
4. 模型比较
我们通过对 GARCH ,TGARCH, EGARCH 模型残差服从正态分布和学生 t 分布的对
数似然函数值 AIC 统计量 和 SC 统计量观察得出 GARCH 模型的 AIC 和 SC 要小于其他两
种模型,而且 GARCH-t 模型的 AIC 和 SC 最小,对数似然值最大,从而我们认为基于我国
上证 50 的最优模型为 GARCH 模型,而且服从 t 分布的 GARCH 模型要优于正态分布的
GARCH 模型。
(表 4 模型的 AIC SC 对数似然函数值对比)
标准正态分布
学生 t 分布
AIC
SC
GARCH
-5.062030
-5.042811
似然值
2603.352
AIC
SC
-5.109447
-5.185223
TGARCH
-5.061639
-5.037616
2604.152
-5.10372
-5.78493
EGARCH
-5.061639
-5.037616
2606.600
-5.109249
-5.080621
似然值
2630.598
2628.609
2629.702
- 6 -
-
-
-
-
-
-
·
-
-
-
-
-
-
-
-
-
-
-
-
http://www.paper.edu.cn
投资者都希望在低位买进股票,并在高位抛出,从而获得较高的收益,下面我们利用学
生 t 分布的 GARCH 模型对上证 50 的真实数据进行拟合,观察原始图型和拟合图形,并通
过白噪声检验可见服从学生 t 分布的 GARCH(1,1)模型是有效的且可以对原始数据进行很好
的拟合,因此可用此模型对上证 50 的收盘价格进行预测和分析.
8.5
8.0
7.5
7.0
6.5
.10
.05
.00
-.05
-.10
-.15
250
500
750
1000
Residual
Actual
Fitted
(图 7 GARCH-t 模型的数据拟合图)
(注:红线表示真实数据,绿线表示拟合数据,蓝色表示残差序列)
5. 模型的预测能力
由于资产价格的波动率是不能直接观察的,我们采用这样的方法来测试模型的预测能
ls (表示从第 t 个数据开始
力,向后再找 10 个数据作为预测样本,可以通过模型得到 2( )
向前预测 L 个步长条件方差的大小, ( )
ls
le + (这是
用 t+L 时刻对数收盘价减去前面 1028 个数据对数收盘价的均值得到的),我们建立如下六
种度量指标做为预测误差评测标准
初值为 0),再通过真实数据,得到 t
2
t
[6]
t
:
(1) 平均平方误差
( )
l
tX l
MSE
1
s
=
(
1 n
n
=
1
l
)2
e +
MSE
2
=
(
1 n
n
=
l
1
( )
l
l
s
2
tt
2
e +
)2
(2) 平均绝对误差
MAE
1
=
1
n
n
=
1
l
s
tt
l
( )
l
e +
MAE
2
=
1
n
n
=
1
l
s
2
tt
l
( )
l
2
e +
(3) 对数损失函数误差
2
e
+
lnln
tl
RLN
=
n
1
n
=
1
l
2( )
l
s
t
2
(4) 高斯准极大似然损失函数误差
QLIKE
=
1
n
n
=
1
l
2( )
l
s
ln( )
t
+
2
e s
+
tl
t
2
l
- 7 -
-
-
-
-
-
Ł
ł
-
Ł
ł
http://www.paper.edu.cn
我们用向前两步预测和向前步十预测来分别判断模型在长期和短期中预测能力的差别。
对比表 6 和表 7 发现短期的几种模型预测能力要明显好于长期,并且通过对相同步数预测能
力的观察发现 GARCH 模型的预测能力要好于其他几种模型,而且 GARCH-t 模型的预测能
力最好,预测能力最差的是 EGARCH-t 模型,这可能和我国股市不存在明显的不对称杠杆
效应有关。得出的预测结论和上面用 AIC 和 SC 以及对数似然值初步判断的结果基本是一致
的。
(表 5 从第 1028 个数据往后不同模型的 10 步条件方差预测值)
GARC
H-N
GARC
H-T
TGAR
CH-N
TGAR
CH-T
EGAR
CH-N
EGAR
CH-T
0.0004
74
0.0004
99
0.0004
39
0.0004
94
0.0004
30
0.0004
91
0.0004
53
0.0004
79
0.0004
18
0.0004
74
0.0004
12
0.0004
75
0.0004
36
0.0004
64
0.0004
01
0.0004
58
0.0004
01
0.0004
65
0.0004
13
0.0004
42
0.0003
78
0.0004
36
0.0003
75
0.0004
40
0.0009
90
0.0009
54
0.0010
61
0.0009
63
0.0008
03
0.0007
72
0.0005
20
0.0005
36
0.0004
71
0.0005
28
0.0004
54
0.0005
21
0.0009
44
0.0009
16
0.0010
04
0.0009
24
0.0007
68
0.0007
52
0.0009
24
0.0009
00
0.0009
71
0.0009
06
0.0007
66
0.0007
61
0.0008
70
0.0008
54
0.0009
09
0.0008
59
0.0007
06
0.0007
14
0.0008
29
0.0008
19
0.0008
60
0.0008
23
0.0006
73
0.0006
92
GARCH-N
GARCH-T
1MSE
0.02338826
88
0.02320992
65
TGARCH-N 0.02364251
TGARCH-T
99
0.02324434
5
EGARCH-N 0.02369780
EGARCH-T
GARCH-N
GARCH-T
03
0.02325055
05
1MSE
0.02782674
1
0.02779008
TGARCH-N 0.02784234
TGARCH-T
96
0.02789486
32
EGARCH-N 0.02848706
EGARCH-T
16
0.02824614
0.152173
1MAE
0.152757
(表 6 未来两日波动率预测误差)
2MAE
0.02996180
25
0.02993632
52
0.02999682
47
0.02994130
93
0.03000432
16
0.02994231
7
2MSE
0.00090384
33
0.00090231
48
0.00090594
32
0.00090261
32
0.00090638
55
0.00090266
38
0.1535865
0.1523085
0.152286
0.153768
0.1647206
1MAE
0.1648203
2MSE
0.00141509
53
0.00141500
96
0.00141456
67
0.00141596
(表 7 未来十日波动率预测误差)
2MAE
0.03630466
2
0.03630366
79
0.03629876
07
0.03630546
37
0.03641116
51
0.03639166
4
0.00142292
25
0.00142078
61
0.1668169
0.1661001
0.1648677
0.1648356
RLN
16.4928458
34
16.0474038
92
16.1567514
2
17.1321555
91
16.3061677
75
17.1479814
96
RLN
16.2810317
11
16.1398890
78
18.4597919
84
17.1663025
48
18.5018617
16
18.8936740
9
QLIKE
53.1179712
23
51.7262827
36
55.4336537
79
52.3595875
87
62.6549010
68
55.4589585
35
QLIKE
55.5041403
7
54.8259348
7
63.9175030
08
58.1389399
99
64.3116709
74
56.4772619
93
- 8 -