国泰君安版权所有发送给富安达基金管理有限公司.公共邮箱:report@fadfunds.com p1
金
融
工
程
[Table_MainInfo]
[Table_Title]
2015.04.26
基于组合权重优化的风格中性多因子选股策略
--数量化专题之五十七
刘富兵(分析师)
李辰(研究助理)
021-38676673
021-38677309
liufubing008481@gtjas.com
lichen@gtjas.com
证书编号 S0880511010017
S0880114060025
本报告导读:
基于股票组合的权重优化方法,构建市值中性、行业中性、风格中性的最优投资组合,
可获得稳健的超额收益。
摘要:
任意股票都在同一时刻暴露于多种不同的风险因素下,它们
[Table_Summary]
之间的共同作用形成了股票价格的波动。通过对不同风险因
子的梳理研究,可实现对股票收益来源的分解剥离,从而定
量的研究股价波动的成因。
量化对冲策略的目标是追求稳健的绝对收益,最优投资组合
的构建是一种完美的平衡状态,投资经理应将组合充分暴露
于阿尔法因子下,同时剔除其余不稳定的风格因素干扰。
通过股票组合的权重优化,实现了市值中性、行业中性、风
格中性约束条件下的最优投资组合构建,获取稳健的超额收
益。
基于组合权重优化的风格中性多因子选股策略,自 2010 年 1
月至 2015 年 3 月,实现年化 12.73%的超额收益,最大回撤
2.09%,信息比率 4.21。
数
量
化
专
题
报
告
证
券
研
究
报
告
6
8
0
3
6
国泰君安版权所有发送给富安达基金管理有限公司.公共邮箱:report@fadfunds.com p1
请务必阅读正文之后的免责条款部分
金融工程
金融工程团队:
刘富兵:(分析师)
电话:021-38676673
邮箱:liufubing008481@gtjas.com
证书编号:S0880511010017
赵延鸿:(分析师)
电话:021-38674927
邮箱:zhaoyanhong@gtjas.com
证书编号:S0880515030004
耿帅军:(分析师)
电话:010-59312753
邮箱:gengshuaijun@gtjas.com
证书编号:S0880513080013
刘正捷:(分析师)
电话:0755-23976803
邮箱:liuzhengjie012509@gtjas.com
证书编号:S0880514070010
吴晶:(分析师)
电话:021-38676720
邮箱:wujing@gtjas.com
证书编号:S0880514110001
李雪君:(研究助理)
电话:021-38675855
邮箱:lixuejun@gtjas.com
证书编号:S0880114090056
王浩:(研究助理)
电话:021-38676434
邮箱:wanghao014399@gtjas.com
证书编号:S0880114080041
陈奥林:(研究助理)
电话:021-38674835
邮箱:chenaolin@gtjas.com
证书编号:S0880114110077
李辰:(研究助理)
电话:021-38677309
邮箱:lichen@gtjas.com
证书编号:S0880114060025
相关报告
[Table_Report]
《 50、 500 期货降临,你准备好了吗?》
2015.04.10
《借道 QDII,分享港股盛宴》2015.04.10
《动量测评之均线策略》2015.04.07
《 成 长 趋 势 因 子 - 财 务 数 据 中 再 掘 金 》
2015.04.01
《 量 化 投 资 框 架 下 的 PPP 主 题 投 资 》
2015.03.14
国泰君安版权所有发送给富安达基金管理有限公司.公共邮箱:report@fadfunds.com p2
数量化专题报告
目录
1. 引言 ........................................................................ 3
2. 结构化多因子风险模型 ........................................................ 3
2.1. 结构化多因子风险模型 ...................................................... 3
2.2. 风险因子筛选 ............................................................. 6
2.2.1. 样本空间 ........................................................... 6
2.2.2. 行业因子 ....................................................................6
2.2.3. 风格因子 ....................................................................6
2.2.4. 因子去极值与标准化 ..........................................................7
2.2.5. 参数估计 ....................................................................8
2.2.6. 因子有效性检验 .............................................................10
2.3. 组合风险预测 .....................................................................12
2.3.1. 因子收益率协方差矩阵预测 ...................................................13
2.3.2. 特质因子风险建模 ...........................................................15
2.4. 风险模型的意义 ...................................................................16
3. 风格中性多因子选股策略 ..................................................... 16
3.1. 纯因子组合 .......................................................................16
3.2. 风险因子与阿尔法因子 .............................................................17
3.3. 行业中性与风格中性 ...............................................................25
3.4. 组合权重优化 .....................................................................26
3.5. 实证检验 .........................................................................28
3.6. 归因分析 .........................................................................33
3.6.1. 因子收益归因 ...............................................................33
3.6.2. 因子风险归因 ...............................................................35
4. 研究总结与展望 ............................................................. 35
国泰君安版权所有发送给富安达基金管理有限公司.公共邮箱:report@fadfunds.com p2
请务必阅读正文之后的免责条款部分 2 of 37
国泰君安版权所有发送给富安达基金管理有限公司.公共邮箱:report@fadfunds.com p3
数量化专题报告
1. 引言
多因子选股作为量化投资研究领域的经典模型,在海内外各类投资机构
均受到广泛研究和实践应用。在国内,自 2010 年沪深 300 股指期货上
线以来,以多因子选股为代表的阿尔法对冲策略也逐渐走入了公众的视
野。然而在 2014 年 12 月的市场行情中,阿尔法对冲策略却遭遇了重大
挫折,究其原因不难发现,组合带有过于明显的市值风格特征是导致策
略收益大幅波动的主要原因。
本篇报告有别于传统的多因子研究,我们并未将重点放在阿尔法因子的
挖掘上,而是着重研究了股票组合的权重优化对策略风格特征的影响。
我们通过对股票组合的权重优化计算,找到了在市值中性、行业中性、
风格因子中性约束下的最优投资组合,获得了稳健的超额收益。
在多因子模型中,决定策略收益稳健性的关键步骤正在于股票组合的权
重配置。因此,从量化对冲策略追求收益稳定性的角度而言,组合权重
优化对多因子模型起着至关重要的作用。
从具体的研究思路而言,我们从结构化多因子风险模型的角度出发,利
用 BARRA 风险因子有效性的检验方法,构建了基于 30 类行业因子、9 类
风格因子的结构化多因子风险模型,奠定了预测股票组合波动率的基
础。之后,我们通过对纯因子股票组合的研究,考察了各类因子阿尔法
性质的强弱,并解释了因子背后的经济、金融学逻辑。最后,我们通过
股票组合的权重优化计算,得到了市值中性、行业中性、风格中性约束
下的最优投资组合。
实证检验表明,通过对股票组合风格特征的约束,策略的收益稳定性大
幅提升。自 2010 年起策略年化收益率为 12.73%,最大回撤为 2.09%,
信息比率为 4.21。并且,归因分析结果也表明,风格中性的组合配置方
式,对策略收益率特征起到了决定性的影响。
2. 结构化多因子风险模型
任意股票在同一时刻都暴露于多种不同的风险因素下,它们之间的共同
作用形成了股票价格的波动。为了定量的研究各种风险因素的作用,量
化风险模型应运而生。
风险模型的意义在于找到股票价格波动的成因,并将股票收益来源进行
分解剥离,并实现对未来股票价格波动的预测。
下面我们从结构化多因子风险模型入手,探究 A 股市场的整体风险结
构。
国泰君安版权所有发送给富安达基金管理有限公司.公共邮箱:report@fadfunds.com p3
2.1. 结构化多因子风险模型
请务必阅读正文之后的免责条款部分 3 of 37
国泰君安版权所有发送给富安达基金管理有限公司.公共邮箱:report@fadfunds.com p4
数量化专题报告
在结构化多因子风险模型之前,存在 3 种基本的风险模型:
第一种基本风险模型即为马科维茨组合方差。在马科维茨的均值方差理
论中,投资组合的风险计算需要估计组合中每个资产的波动率及它们之
间的相关系数。一般的,当组合中有 只股票的情况下,需要估计的波
动率个数为 ,而需要估计的相关系数的个数则为
。我们
可以将所需要顾及的参数总结到一个协方差矩阵 中:
其中 表示 和 的协方差,并且
。协方差矩阵包含了计算组
合风险所需的全部要素。然而,该方法的缺点是协方差矩阵中包含了太
多的独立参数,无法精确且高效的预测协方差矩阵。
第二种基本风险模型需要对每只股票的波动率 ,以及股票之间的平均
相关系数 进行估计。这意味着任意两只股票之间的协方差为
这种模型的最大优点就是简单,然而该模型忽略了类似行业或者具有相
似属性的股票之间的微妙联系。
第三种基本风险模型依赖于历史数据的样本方差和样本协方差。该类模
型 用 个 时 期 的 样 本 来 估 计 一 个
的 协 方 差 矩 阵 , 并 且 要 求
,这就意味着,如果要估计沪深 300 指数成分月度收益率的
协方差矩阵,将需要至少超过 25 年的历史数据,这在应用中显然不切
实际。
为了克服与改进上述三种基本风险模型的缺陷,结构化多因子风险模型
应运而生。结构化风险因子模型利用一组共同因子和一个仅与该股票有
关的特质因子解释股票的收益率,并利用共同因子和特质因子的波动来
解释股票收益率的波动。结构化多因子风险模型的优势在于,通过识别
重要的因子,可以降低问题的规模,只要因子个数不变,即使股票组合
的数量发生变化,处理问题的复杂度也不会发生变化。
结构化多因子风险模型首先对收益率进行简单的线性分解,分解方程中
包含四个组成部分:股票收益率、因子暴露、因子收益率和特质因子收
益率。那么,第 只股票的线性分解如下所示:
国泰君安版权所有发送给富安达基金管理有限公司.公共邮箱:report@fadfunds.com p4
其中, 表示第 只股票的收益率; 表示第 只股票在第 个因子上
请务必阅读正文之后的免责条款部分 4 of 37
NN1)/2NN(V211212122221 ... ... ... ... ... ... ... ... NNNNVijirjrijjin{,}nmnmCovrrTNN1TNj11223344...jKKjrxfxfxfxfxfujrjkxjk
国泰君安版权所有发送给富安达基金管理有限公司.公共邮箱:report@fadfunds.com p5
数量化专题报告
的暴露(也称为因子载荷); 表示第 只股票第 个因子的因子收益
率(即每单位因子暴露所承载的收益率); 表示第 只股票的特质因
子收益率。
对于上述方程的时间结构,若我们定义因子暴露是在时刻 的结果,那
么股票收益率、因子收益率和特质因子收益率均为
中,我们以月频率处理截面数据。
的结果。在模型
那 么 对 于 一 个 包 含 只 股 票 的 投 资 组 合 , 假 设 组 合 的 权 重 为
,那么组合收益率可以表示为:
现在我们假设每只股票的特质因子收益率与共同因子收益率不相关,并
且每只股票的特质因子收益率也不相关。那么在上述表达式的基础上,
可以得到组合的风险结构为:
其中, 表示 只个股在 个风险因子上的因子载荷矩阵(
):
表示 个因子的因子收益率协方差矩阵(
):
其中,因子收益率的波动率和协方差以因子收益率的日频率数据估算。
表示 只股票的特质因子收益率协方差矩阵(
):
由于我们假设每只股票的特质因子收益率相关性为 0,因此 为对角阵。
国泰君安版权所有发送给富安达基金管理有限公司.公共邮箱:report@fadfunds.com p5
结构化多因子风险模型对于投资者的意义并不在于最小化组合风险,而
是在给定组合预期收益率的情况下,赋予最优的风险权重。这一点我们
请务必阅读正文之后的免责条款部分 5 of 37
kfjkjujt1tN12(,,...,)TNwwww11()NKPnjkjkjjkRwxfu()TTPwXFXwXNKNK1,11,21,2,12,22,,1,2, ... ... ... ... ... ... ... kknnnkxxxxxxXxxxFKKK1121122212 () (,) ... (,)(,) () ... (,) ... ... ... ... (,) (,) ... kkkkVarfCovffCovffCovffVarfCovffFCovffCovff ()kVarfNNN12 () 0 ... 0 0 () ... 0 ... ... ... ... 0 0 ... ()kVaruVaruVaru
国泰君安版权所有发送给富安达基金管理有限公司.公共邮箱:report@fadfunds.com p6
数量化专题报告
会在后面的组合权重优化中讨论。
2.2. 风险因子筛选
2.2.1. 样本空间
与大多海外成熟市场不同,A 股市场中市值最大、流动性最好的股票池
并不能完整的反应 A 股市场的全部特征。因此,我们对风险因子检验的
样本空间选取全部 A 股标的池。
2.2.2. 行业因子
下面我们来讨论风险模型中的共同因子部分,在 BARRA 的结构化多因子
风险模型中,通常将共同因子分为行业因子和风格因子两部分。
行业因子是风险模型的重要部分,通过对 A 股市场全部个股的行业划分,
反应了个股所属行业的独有特点。我们在申万一级 28 个行业分类的基
础上,将非银金融行业划分为证券、保险和多元金融 3 个子行业。因此,
我们的风险模型包含 30 个行业因子,具体为:
表 1: 行业因子分类
交通运输
医药生物
房地产
纺织服装
钢铁
休闲服务
商业贸易
有色金属
综合
银行
传媒
国防军工
机械设备
计算机
证券
数据来源:国泰君安证券研究
2.2.3. 风格因子
公用事业
家用电器
汽车
轻工制造
保险
农林牧渔
建筑材料
电子
通信
化工
建筑装饰
电气设备
采掘
多元金融
食品饮料
风格因子是共同因子中另一重要部分,风格因子将在后面我们讨论纯因
子组合与股票组合权重优化中起到至关重要的作用。风格因子总共包含
9 大类因子、20 个小因子,其中大类因子包含 Beta、Momentum、Size、
Earnings Yield、Volatility、Growth、Value、Leverage 和 Liquidity,
具体为:
因子计算方式
;利用个股收益率序列和沪深 300 指数收益率序列进行一元线性回归,益率序列
表 2: 风格因子分类构建
大类
因子
小类
因子
Beta
BETA
长度取 250 交易日。股收益率序列和沪深 300 指数收益率序列均以半衰指数加权,半衰期为 60 日。
Momentum
RSTR
;其中 T=500,L=21,收益率序列以半衰指数加权,半衰期为 120 日。
Size
LNCAP
国泰君安版权所有发送给富安达基金管理有限公司.公共邮箱:report@fadfunds.com p6
;个股总市值对数值。
请务必阅读正文之后的免责条款部分 6 of 37
imirre[ln(1)]TLtttLRSTRwr(__)LNCAPLNtotalmarketcapitalization
国泰君安版权所有发送给富安达基金管理有限公司.公共邮箱:report@fadfunds.com p7
数量化专题报告
EPIBS
;其中
为个股一致预期基本每股收益。
Earnings
Yield
ETOP
前市值。
CETOP
DASTD
Volatility
CMRA
;历史 EP 值,利用过去 12 个月个股净利润除以当
;个股现金收益比股票价格。
;其中收益率序列长度取 250 个交易日,半衰期设定为 40 日。
;
其中
; 表示个股月收益率,T 代表过去 12 个月。
HSIGMA
;其中残差 为 BETA 计算中所得。
Growth
SGRO 过去 5 年企业营业总收入复合增长率。
EGRO 过去 5 年企业归属母公司净利润复合增长率。
EGIB 未来 3 年企业一致预期净利润增长率。
EGIB_S 未来 1 年企业一致预期净利润增长率。
Value
BTOP
计算企业总权益值除以当前市值。
;
MLEV
;其中
表示企业当前总市值,
表示企业长期负债。
Leverage
DTOA
;其中
表示总负债 表示总资产。
BLEV
STOM
;其中
表示企业账面权益,
表示企业长期负债。
;其中 表示当日成交量, 表示流通股本。
Liquidity
STOQ
STOA
数据来源:国泰君安证券研究
;其中 T=3。
;其中 T=12。
其中,风格因子 Earnings Yield、Volatility、Growth、Leverage 和
Liquidity 均利用若干小类因子组合得到。其中,我们利用样本内单类
因子回归最小化残差平方和的方法得到小类因子的组合权重。
2.2.4. 因子去极值与标准化
为了统计回归方程的量纲,通常需要将因子作标准归一化处理,其中包
括去极值与标准化两部分。
较为传统去极值的方法有 3 倍标准差法和中位数法。在 BARRA 的风险模
型中,普遍采用 3 倍标准差法,但是我们研究发现,3 倍标准差法在处
国泰君安版权所有发送给富安达基金管理有限公司.公共邮箱:report@fadfunds.com p7
请务必阅读正文之后的免责条款部分 7 of 37
_/EPIBSestepsP_esteps_/_ETOPearningsttmmktfreeshares_/CETOPCashearningsP21/21((()))TtttDASTDwrr(1max{()})(1min{()})CMRAlnZTlnZT1()[(1)]TZTlnrr()iHSIGMAstdeie_/__BTOPcommonequitycurrentmarketcapitalization()/MLEVMELDMEMELD/DTOATDTATDTA()/BLEVBELDBEBELD211ln((/)tttSTOMVStVtS11ln(exp())TSTOQSTOMT11ln(exp())TSTOASTOMT
国泰君安版权所有发送给富安达基金管理有限公司.公共邮箱:report@fadfunds.com p8
数量化专题报告
理分布偏度较大的因子截面时,仍然会产生异常结果影响回归方程的稳
定性,因此我们使用中位数法剔除因子异常值。
标准化的处理过程包括标准正态法、加权标准正态法、Box-Cox 变
换、Johnson 变换等方法。在 BARRA 的风险模型中,采用根号市值加权
的标准正态法,在一定程度上剔除了市值的影响,但是这样的方法会造
成标准化因子截面的均值不等于 0,这在之后的股票组合权重优化的风
险敞口设置时会产生一定的偏差,考虑到这点,我们仅采用简单的标准
正态法,即:
其中, 为标准化因子序列,
为原始因子序列, 为
的算术
平均值, 为
的标准差。
2.2.5. 参数估计
结构化风险模型给出了任一股票收益率的线性分解形式:
那么对于 只股票的组合而言,组合的收益率向量可以写成:
其中, 表示所有因子的载荷矩阵,由行业因子哑变量矩阵和公共因子
载荷矩阵构成, 表示所有因子的因子收益率, 表示残差序列。那么
对于结构化风险模型而言,需要在已知股票收益率 和因子载荷矩阵
的情况下,对因子收益率向量 进行估计。
根据最小二乘法(
),我们需要找到收益率向量 使得残差平方和
达到最小,即:
令
,得到
,因此
。
国泰君安版权所有发送给富安达基金管理有限公司.公共邮箱:report@fadfunds.com p8
最小二乘估计法仅当不同股票的残差序列 方差相同时, 才是
最优估计。然而,通常情况下,金融时间序列的数据均存在较明显的异
请务必阅读正文之后的免责条款部分 8 of 37
rawnllnlldudnldrawnldlurawnldlrawnld11223344...jKKjrxfxfxfxfxfuNRXfUXfURXfOLSf2211ˆ ()ˆˆ =()()ˆˆˆˆ =()ˆˆˆ = 2NNiiiiiMinQrrRXfRXfRRRXffXRfXXfRRfXYfXXf0ˆQfˆ+0XRXXf-1ˆ()fXXXROLSitˆf