相关研究
金融工程助理分析师
张峰
电话:021-23219370
Email:zhangfeng@htsec.com
金融工程首席分析师
胡倩
电话:021-23219472
Email:huqian@htsec.com
量量化化研研究究
量化交易策略
量化交易策略系列报告(二)
2009 年 08 月 10 日
择时+指数化投资—基于海通 SWARCH 模型
的量化周择时策略研究
海通 SWARCH 模型的优势。前期我们构建的 SWARCH 模型在分析货币供应周
期和证券市场趋势的关系上取得了超过 88%的预测精度。后来,我们又将这种建
模的思想加以改进并且应用在对各个具体行业指数趋势的研究上,即所谓的
L_SWARCH 行业模型,模型同样取得了良好的预测效果。
本篇报告中我们主要应用前期开发的海通 L_SWARCH 模型研究我国股票市场的
价格变动与交易量之间的相关关系,对我国证券市场中典型指数的每周涨跌趋势
进行预测,并以此为基础构建基于量价关系的程序化交易系统。
量化模型指标的选取。在具体构建量价关系模型的过程中我们考虑了众多的与标
的指数的收盘价与成交量相关的指标,最终我们选取了标的指数的周收益率数
据、标的指数的周日均成交量数据和标的指数的 10 日股价动量数据作为量化择
时模型的基础指标。
模型对标的指数周涨跌趋势的预测精度达到了 65%以上。实证中我们分别选取
了沪深 300 指数和上证综合指数作为量化择时策略的标的指数,对沪深 300 指
数我们做了 129 期的样本外预测,准确率达到了 65.9%,对上证综合指数我们做
了 252 期的样本外预测,准确率也达到了 65.5%。
量化择时策略获得了较好的超额收益。在考虑了千分之五的单边交易费用的情况
下,以沪深 300 指数为标的的量化择时策略从 2007 年 1 月 1 日到 2009 年 7 月
17 日净值增长了 2.55 倍,而同期的沪深 300 指数仅增长了 0.73 倍;以上证综
合指数为标的的量化择时策略从 2004 年 7 月 16 日到 2009 年 7 月 17 日净值增
长了 2.13 倍,而同期的沪深 300 指数仅为 1.23 倍。从相对强弱指标来看,量化
择时策略在绝大多数的时期都明显地超越了[50%标的指数+50%现金]的基准组
合的收益表现。
我们将在随后的系列报告中继续量化交易策略的研究,并且针对我国 A 股市场
的交易环境做详细的实证研究。
请务必阅读正文之后的免责条款
定量研究·选股策略
2
目 录
1. 海通 SWARCH 模型的研究思路与成果 ............................................................................4
2. 量化择时模型的实证效果分析............................................................................................4
2.1 实证数据描述 .......................................................................................................... 4
2.2 沪深 300 指数为标的指数的实证效果................................................................. 4
2.3 上证综合指数为标的指数的实证效果 ................................................................. 6
3. 模型参数估计的结果和解释................................................................................................7
4. 总结 .......................................................................................................................................8
5. 附录:量化择时交易模型的构建........................................................................................9
定量研究·选股策略
3
图目录
图 1 L_SWARCH 量价分析模型的预测结果(基于沪深 300 指数) ..................................5
图 2 量价分析择时模型的绝对收益表现(基于沪深 300 指数) ........................................5
图 3 量价分析择时模型的相对强弱表现(基于沪深 300 指数) ........................................6
图 4 L_SWARCH 量价分析模型的预测结果(基于上证指数) ..........................................6
图 5 量价分析择时模型的绝对收益表现(基于上证指数) ................................................7
图 6 量价分析择时模型的相对强弱表现(基于上证指数) ................................................7
图 7 沪深 300 指数的周收益率与指数周日均成交金额的增长率比较...................................8
定量研究·选股策略
4
股票市场的量价关系是指市场指数或者个股的价格变化与交易量(交易金额)之间的相
关关系。由于量价关系是股票技术分析理论的重要基石,也是广大投资者在投资实践中判断
市场或个股运行趋势的主要手段之一,因此对量价关系的研究具有比较重要的理论和现实意
义。但是股票市场的量和价之间绝对不是简单的线性对应关系,也正因为如此,量价关系理
论一直是金融领域研究的热点课题之一。
大量的研究表明,交易量与价格变化之间呈正向的相关关系。但是交易量与价格变化之
间到底具有怎样的深层关系,或者这种非线性的关系到底应该怎样来刻画?本篇报告中我们
希望能够使用数量建模的方法来揭示这种关系,并以此为基础构建具体的量化交易策略。
1. 海通 SWARCH 模型的研究思路与成果
在前期的《宏观经济周期与证券市场的趋势相关性研究》与《海通 SWARCH 模型在台
湾市场的实证检验》两篇报告中,我们利用向量 SWARCH 模型建立了宏观货币供应周期与
证券市场趋势之间的关联性,取得了良好的实证效果。在 A 股市场我们做了 33 期的样本外
预测,准确率达到了 88%以上,在台湾市场上我们做了近 90 期的样本外预测,准确度也达
到了 72%以上。
我们将这种 SWARCH 模型建模的思想加以改进并且应用在量化的行业研究上,预测各
个具体行业指数的月度涨跌趋势,即所谓的 L_SWARCH 行业模型。目前我们将该模型应用
在海通石化、房地产、和银行业指数上都得了良好的实证效果,预测的准确率均达到了 80%
以上。
SWARCH 模型在各个量化领域取得的成功也促使我们进一步地研究模型背后隐含的逻
辑,我们发现 SWARCH 建模的思想非常适合研究多变量之间复杂而又明确的联动关系。首
先,SWARCH 模型将研究变量划分为不同的状态,进而研究各变量的状态之间的转移关系,
这显然比一般传统上对研究变量具体数值的刻画要相对容易,而且可以有效地避免出现样本
内“过度拟合”的现象;其次,SWARCH 模型建立了研究变量与解释变量之间非线性的关
系,是一种非线性的量化建模方法。SWARCH 模型具有的这些优势使我们有理由相信其对
研究量价关系理论这一明确而又复杂的关系必然有一定的适用性。
2. 量化择时模型的实证效果分析
在这一部分中,我们分别以沪深 300 指数和上证综合指数为标的指数建模,并且对模型
实证检验的结果进行详细地讨论和解释。由于我们的投资标的均为大盘指数,所以我们选择
[50%的标的指数+50%的现金]组合作为我们择时投资策略收益的比较基准。
2.1 实证数据描述
在本篇报告的实证检验中,我们具体分别选取沪深 300 指数和上证综合指数作为投资的
标的指数,由于沪深 300 指数是从 2005 年 1 月才开始编制的,所以我们选取沪深 300 指数
2005 年 1 月 7 日至 2009 年 7 月 17 日的量价数据进行实证研究;考虑到沪深 300 指数样本
期比较短的缺陷,我们又选取了上证综合指数 2002 年 7 月 12 日至 2009 年 7 月 17 日的数
据进行实证分析。
我们从 Wind 数据库中提取沪深 300 指数自 2005 年 1 月 7 日至 2009 年 7 月 17 日的周
收盘价数据和成交量数据,并计算沪深 300 指数的 10 日股价动量;从 Wind 数据库中提取上
证综合指数自 2002 年 7 月 12 日至 2009 年 7 月 17 日的周收盘价数据和成交量数据,并计
算指数的 10 日股价动量。
2.2 沪深 300 指数为标的指数的实证效果
定量研究·选股策略
5
我们以沪深300指数从2005年1月7日至2006年12月29日共98周数据作为模型的初始训
练样本,对标的指数从2007年1月5日到2009年7月17日共129周的数据做(每一期)样本外
的滚动预测,即在每一期我们都会利用最新的样本数据更新模型的参数并对指数下一期的涨
跌进行预测。模型预测期的准确率达到了65.9%。下图中我们列示出了模型样本外的预测结
果,如果模型预测结果正确(与真实的涨跌情况比较)记为1,而如果模型预测结果错误则记
为-1。
图 1 L_SWARCH 量价分析模型的预测结果(基于沪深 300 指数)
模 型 预 测 结 果
沪 深 300指 数
2007-03-30
2007-06-22
2007-09-14
2007-12-14
2008-03-07
2008-05-30
2008-08-22
2008-11-21
2009-02-20
2009-05-15
1.5
1
0.5
0
2007-1-1
-0.5
-1
-1.5
3
2.5
2
1.5
1
0.5
0
资料来源:海通证券研究所
从图1中模型的预测结果我们可以看出,当标的指数运行趋势比较明显时量价配合关系比
较明确,这时模型的预测精度也比比较高;而当标的指数处于震荡时期或者原有趋势将改变
时量价之间关系的不确定性增强,模型的出错率也比较高。
我们基于L_SWARCH量价关系模型的预测结果构建了如下简单的量化交易策略:当模型
判断下周指数将上涨时我们全仓持有标的指数,而当模型判断下周指数将下跌时我们则全仓
持有现金。下图2中我们列示出了择时策略收益的表现情况。
图 2 量价分析择时模型的绝对收益表现(基于沪深 300 指数)
6
5
4
3
2
1
0
2007-1-1
择 时策 略 收 益 (无 交 易 费 )
%50沪 深 300指 数 +50%现 金
择 时策 略 收 益 (单 边 0.5%交易 费 )
沪 深 300指数
2007-03-30
2007-06-22
2007-09-14
2007-12-14
2008-03-07
2008-05-30
2008-08-22
2008-11-21
2009-02-20
2009-05-15
资料来源:海通证券研究所
从上图2中可以看出,我们量化择时策略的收益明显地超越了作为比较基准的沪深300指
数和[50%标的指数+50%现金]组合,在不考虑交易费用的情况下策略的期末净值达到了5.03
定量研究·选股策略
6
倍,如果考虑千分之五的单边交易费用则策略的期末净值为3.55倍,而同期沪深300指数的净
值为1.73倍,[50%标的指数+50%现金]组合的期末净值仅为1.39倍。
在图2中我们还发现一个有趣的现象:我们的量化择时模型具有良好的止损效果(虽然我
们没有刻意去设置这样一个止损策略),这是由于当标的指数涨跌趋势比较明确时模型预测的
准确度比较高的缘故。下图3中列示了我们量化择时策略与[50%标的指数+50%现金]基准组
合的相对强弱比较。
图 3 量价分析择时模型的相对强弱表现(基于沪深 300 指数)
4
3.5
3
2.5
2
1.5
1
0.5
0
2007-1-1
择 时 策 略 与 基 准 的 相 对 强 弱 比 较 ( 无 交 易 费 用 )
择 时 策 略 与 基 准 的 相 对 强 弱 比 较 ( ( 单 边 0.5%交 易 费 )
2007-03-30
2007-06-22
2007-09-14
2007-12-14
2008-03-07
2008-05-30
2008-08-22
2008-11-21
2009-02-20
2009-05-15
资料来源:海通证券研究所
从上面相对强弱的比较结果可以看出,我们的量化择时模型在大多数的时期都明显地超
越了基准组合的收益表现,这说明我们的量化择时模型是持续有效的。
2.3 上证综合指数为标的指数的实证效果
与 2.2 节中相似,我们应用上证综合指数从 2002 年 7 月 12 日至 2004 年 7 月 9 日共 100
周数据作为模型的初始训练样本,以指数从 2004 年 7 月 16 日到 2009 年 7 月 17 日共 252
周的数据做样本外的(每一期)滚动预测,预测期的准确率同样达到了 65.5%。下图中我们
列示出了模型对样本外数据的预测结果,如果模型预测结果正确(与真实的涨跌情况比较)
记为 1,而如果模型预测结果错误则记为-1。
图 4 L_SWARCH 量价分析模型的预测结果(基于上证指数)
模 型 预 测 结 果
上 证综 合 指 数
2004-
09-30
2004-
12-24
2005-
03-25
2005-
06-24
2005-
09-16
2005-
12-16
2006-
03-17
2006-
06-16
2006-
09-08
2006-
12-08
2007-
03-09
2007-
06-01
2007-
08-24
2007-
11-23
2008-
02-15
2008-
05-09
2008-
08-01
2008-
10-31
2009-
01-23
2009-
04-24
1.5
1
0.5
0
2004-
7-9
-0.5
-1
-1.5
4.5
4
3.5
3
2.5
2
2009-
07-17
1.5
1
0.5
0
定量研究·选股策略
7
资料来源:海通证券研究所
同样地,我们基于模型的预测结果构建量化交易策略:当模型判断下周指数将上涨时我
们全仓持有标的上证指数,而当模型判断下周指数将下跌时我们则全仓持有现金。下图5中我
们列示出了量化择时策略收益的表现情况。
图 5 量价分析择时模型的绝对收益表现(基于上证指数)
8
7
6
5
4
3
2
1
0
2004-
7-9
择时 策 略 收益 ( 无 交易 费 )
%50上 证综 合 指数 +50%现金
择 时 策 略收 益 ( 单边 0.5%交易 费 )
上 证 综 合指 数
2004-
09-30
2004-
12-24
2005-
03-25
2005-
06-24
2005-
09-16
2005-
12-16
2006-
03-17
2006-
06-16
2006-
09-08
2006-
12-08
2007-
03-09
2007-
06-01
2007-
08-24
2007-
11-23
2008-
02-15
2008-
05-09
2008-
08-01
2008-
10-31
2009-
01-23
2009-
04-24
200
07-
资料来源:海通证券研究所
从上图5中可以看出,我们量化择时策略的收益明显地超越了作为比较基准的上证综合指
数和[50%标的指数+50%现金]的基准组合,在不考虑交易费用的情况下策略的期末净值达到
了7.23倍,如果考虑千分之五的单边交易费用则策略的期末净值为3.13倍,而同期上证综合
指数的净值为2.23倍,[50%标的指数+50%现金]的基准组合的期末净值仅为1.58倍。下图6
中我们列示出了量化择时策略与对应基准组合收益的相对强弱比较。
图 6 量价分析择时模型的相对强弱表现(基于上证指数)
5
4.5
4
3.5
3
2.5
2
1.5
1
0.5
0
2004-
7-9
择 时 策 略 与 基 准 的 相 对 强 弱 比 较 ( 无 交 易 费 用 )
择 时 策 略 与 基 准 的 相 对 强 弱 比 较 ( 单 边 0.5%交 易 费 )
2004-
09-30
2004-
12-24
2005-
03-25
2005-
06-24
2005-
09-16
2005-
12-16
2006-
03-17
2006-
06-16
2006-
09-08
2006-
12-08
2007-
03-09
2007-
06-01
2007-
08-24
2007-
11-23
2008-
02-15
2008-
05-09
2008-
08-01
2008-
10-31
2009-
01-23
2009-
04-24
200
07-
资料来源:海通证券研究所
从相对强弱的比较结果可以看出,上证综合指数为标的的量化择时模型在大多数的时期
也都明显地超越了基准组合的收益表现。
3. 模型参数估计的结果和解释
定量研究·选股策略
8
关于量化择时交易模型具体的构建方法我们放在了后面的附录部分,在这一部分中我们
将列出并详细地解释模型参数估计的结果,希望能够比较有效地揭示出我国证券市场量价关
系的复杂性和确定性。
第一,标的指数的周日均成交金额的增速指标对指数周涨跌具有强的解释意义。
图 7 沪深 300 指数的周收益率与指数周日均成交金额的增长率比较
沪 深 300指 数 周 收 益 率 (左 轴 )
沪 深 300指 数( 左 轴 )
指 数 周 日 均 成 交 金 额 的 增 长 率 ( 右 轴 )
2005-
07-29
2005-
10-28
2006-
01-20
2006-
04-21
2006-
07-21
2006-
10-20
2007-
01-12
2007-
04-13
2007-
07-06
2007-
09-28
2007-
12-28
2008-
03-21
2008-
06-13
2008-
09-05
2008-
12-05
2009-
03-06
2009-
05-27
25
20
15
10
5
0
2005-
04-29
-5
-10
-15
-20
2
1.5
1
0.5
0
-0.5
-1
-1.5
-2
资料来源:海通证券研究所
参数估计结果显示:标的指数的成交金额增长率指标对指数涨跌趋势具有明显的正向作
用。无论在指数的上涨或者下跌趋势中,成交金额的加速增长都会加强原有的趋势的运行,
并且成交额增长率指标在指数上涨趋势中的作用要比指数下跌趋势的作用大。从上图 7 中我
们也可以看出,在指数运行趋势明显的时候,量价关系配合比较好,而当指数在盘整趋势时,
量价关系不是特别明确。
第二,标的指数的股价动量指标对指数周涨跌也具有比较强的解释意义。
参数估计的结果显示:标的指数的 10 日股价动量指标在指数上涨和下跌趋势中的作用是
不相同的。在标的指数的下跌的趋势中,股价动量的增加会加强股指的反转,而在标的指数
上涨的趋势中,股价动量的增加则会加强股指上涨的趋势。
4. 总结
第一,从前面的分析结果中我们可以看出,模型能够比较有效地揭示我国证券市场指数
价格变化与交易金额之间的相关关系,对指数周涨跌趋势具有较好的预测效果。而且基于该
预测模型构建的量化择时交易策略也具有明显的超额收益。
第二,量化择时交易模型频繁交易导致的交易费用比较高。特别是上证指数标的择时模
型在不考虑交易费用的情况下期末净值达到了7.23倍,而在扣除了单边千分之五的交易费用
之后,择时模型的期末净值仅为3.13倍。这主要是因为在标的指数盘整的时期,模型会容易
出错而导致频繁地换仓,这通常会极大程度上稀释量化交易策略的收益。
第三,我们的量化择时模型还有很多值得改进的地方。前面的分析中我们也看出,量价
关系在标的指数上涨、下跌、盘整阶段的表现是不尽相同的,我们的模型只区分了上涨和下
跌的状态,缺少对指数盘整阶段量化关系表现的详细刻画;我们模型策略比较简单,缺乏完
整的止损、过滤交易信号的方法。