logo资料库

多因子选股模型之因子分析与筛选.pdf

第1页 / 共39页
第2页 / 共39页
第3页 / 共39页
第4页 / 共39页
第5页 / 共39页
第6页 / 共39页
第7页 / 共39页
第8页 / 共39页
资料共39页,剩余部分请下载后查看
金 融 工 程 数 量 化 专 题 报 告 证 券 研 究 报 告 2011.09.26 多因子选股模型之因子分析与筛选Ⅰ:估值与财务成长类指标 ——数量化研究系列之十七 蒋瑛琨 021-38676710 jiangyingkun@gtjas.com S0880511010023 编号 本报告导读: 本报告为多因子选股研究系列的第一篇,通过多角度和更细致的测算,分析了因子的 有效性和稳健性,并总结归纳了一些有意义的结论,为建立多因子选股模型奠定基础。 摘要: 本报告通过多角度、更严格的测算方法分析了估值类和财务成长类共 22 个因子指标的有效性,给出了最全面和细致的分析结果,为构建多因子选 股模型和指导实际投资提供了很多有价值的信息。 本文的创新之处: (1)专注于单因子分析。通过最全面和最细化的分析,挖掘出最有效和 稳健的因子。 (2)提出了更严格和更全面的度量因子有效性的方法。通过多角度、更 严格的方法度量因子有效性和稳健性,确保了分析结果不受数据的偶然巧 合所影响。我们从因子排序后的 TOP 20%与 BOTTOM 20%、TOP 40%与 BOTTOM 40%组合的表现差异及稳定性,以及因子排名与收益率排名的 相关性 3 个方面来度量因子有效性。 (3)分析了不同股票池和不同市场环境下因子的有效性。为了提高各个 因子在个股之间的可比性,我们分别在 HS300 和 ZZ500 成分股中分总体、 周期类、非周期类共 6 个股票池中进行因子的有效性分析。并统计分析了 不同市场环境下的因子有效性,为指导实际投资提供更全面的信息。 (4)更符合实际的数据处理方式。由于上市公司财报公布的时间有滞后 和差异,我们对数据进行了合理的处理,确保在历史的每个时点只使用当 时可以得到的数据信息,并使指标值在个股间具有较好的可比性。 主要结果分析: (1)HS300 中,首选有效因子有:PS,PCF,营业收入增长率(单季、 同比),净利润增长率(单季、同比),经营现金流增长率(单季、同比), ROE 增长率(单季、同比),ROA 增长率(单季、同比、TTM)。ZZ500 中,首选有效因子有:PS,PB,EV/EBITDA,净利润增长率(单季)。 另外,备选因子以及分周期与非周期测算的结果见表 24。 (2)市值大小对因子有效性影响显著:如 ROE、ROA 增长率在 HS300 中有效性明显,而在 ZZ500 中几乎无效;EV/EBITDA 则反之。 (3)估值:PS 最有效,PE 在非周期中有效性高:总体来看,PS 有效性 在所有因子中最高,在周期股中相对更高;PE 只在非周期中表现有效。 (4)PB 熊市表现更好,财务增长率指标震荡市表现最佳。 (5)财务指标的短期增长率更有效:营业收入、净利润等财务指标的单 季和同比增长率的有效性高于 TTM 增长率。 (6)PE 不是最小的最好,而是较小的更好。 (7)因子有效性的汇总结果见表 25。 请务必阅读正文之后的免责条款部分 金融工程 单因子分析框架: 1. 将股票池按因 子排序分档 单因子 各 20% 2.计算各档平均收益 Ri ,并按收益大小得到 各档排序号 Ni 平均收益 收益排名 大 小 一档 二档 三档 四档 五档 R1 R2 R3 R4 R5 N1 N2 N3 N4 N5 3. 分析因子的 有效性 计算并分析一档与五档 的收益差:R1- R5 计算并分析一二档与四 五档的平均收益差: (R1+ R2)/2- (R4+R5)/2 计算因子排序与收益排 序的相关性: CORREL([1,2,3,4,5],[N1, N2,N3,N4,N5]) 相关报告 《风格投资 III:A 股周期非周期风格轮动 研究——数量化研究系列之十六》 2011.09.15 《基于全市场的 GARP 选股研究》——数 量化研究系列之十五 2011.09.14 《基于动量和阻力测算的短线择时模型 ——数量化系列研究之十四》 2011.08.21 《市场情绪指数的建立及应用——数量化 研究系列之十三》 2011.07.11 《基于沪深 300 成分股的动量反转选股 策略——数量化系列研究之十二》 2011.05.13
数量化专题报告 目 录 1. 本报告的创新之处 ................................................................................................................................................3 1.1. 专注于挖掘有效因子 ................................................................................................................................3 1.2. 提出了更严格和更全面的度量因子有效性的方法 .................................................................................3 1.3. 分析了不同股票池和不同市场环境下各因子的有效性 .........................................................................3 1.4. 更符合实际的数据处理方式 .....................................................................................................................4 2. 研究思路 ................................................................................................................................................................4 2.1. 研究框架 ....................................................................................................................................................4 2.2. 因子选取 ....................................................................................................................................................4 2.2.1. 因子选取说明 ................................................................................................................................4 2.2.2. 数据处理说明 ................................................................................................................................5 2.3. 股票池的划分 ............................................................................................................................................6 2.3.1. 按市值特征 ....................................................................................................................................6 2.3.2. 按行业属性 ....................................................................................................................................6 2.4. 分析因子有效性 ........................................................................................................................................6 2.4.1. 因子有效性的度量 .........................................................................................................................6 2.4.2. 按市场环境对因子有效性进行分析 .............................................................................................7 3. 主要结果和分析 ....................................................................................................................................................7 3.1. 单因子有效性分析 ....................................................................................................................................7 3.1.1. 市盈率 PE(TTM) ......................................................................................................................8 3.1.2. 不含非经常性损益的市盈率 PE(TTM) ...................................................................................9 3.1.3. 市盈率相对盈利增长率 PEG(TTM) ......................................................................................10 3.1.4. 市销率 PS(TTM) ..................................................................................................................... 11 3.1.5. 市现率 PCF(TTM) ..................................................................................................................12 3.1.6. 市净率 PB .....................................................................................................................................13 3.1.7. 企业价值倍数 EV/EBITDA.........................................................................................................14 3.1.8. 营业收入增长率—单季 ...............................................................................................................16 3.1.9. 营业收入增长率—同比 ...............................................................................................................17 3.1.10. 营业收入增长率—1 年(TTM) ...............................................................................................18 3.1.11. 净利润增长率—单季 ...................................................................................................................19 3.1.12. 净利润增长率—同比 ...................................................................................................................20 3.1.13. 净利润增长率—1 年(TTM) ...................................................................................................21 3.1.14. 经营性现金流增长率—单季 .......................................................................................................22 3.1.15. 经营性现金流增长率-同比 .........................................................................................................24 3.1.16. 经营性现金流增长率-1 年(TTM) ..........................................................................................25 3.1.17. ROE 增长率(单季) ..................................................................................................................26 3.1.18. ROE 增长率(同比) ..................................................................................................................27 3.1.19. ROE 增长率(TTM) .................................................................................................................28 3.1.20. ROA 增长率(单季) .................................................................................................................29 3.1.21. ROA 增长率(同比) .................................................................................................................30 3.1.22. ROA 增长率(TTM) .................................................................................................................31 3.2. 因子有效性的汇总分析...........................................................................................................................32 3.2.1. 有效因子一览 ..............................................................................................................................33 3.2.2. 几点有意义的结论 .......................................................................................................................33 3.2.3. 因子有效性的汇总结果 ...............................................................................................................34 请务必阅读正文之后的免责条款部分 2 of 39
数量化专题报告 O. 多因子选股系列研究 多因子选股是量化研究中最热点的问题之一,已经有比较广泛的研究和 应用。我们认为,检验和筛选出有效且稳健的因子是多因子选股模型取 得良好效果的关键。 我们将开展多因子选股系列研究,前两篇报告专注于单因子分析和测 算,筛选出有效且稳健的因子。我们共分析了五大类指标:估值类(7 个指标)、财务成长类(15 个指标)、财务质量类(10 个指标)、价量类 (6 个指标)、分析师预期类(2 个指标)。为了篇幅适中,我们第一篇 报告分析和测算估值类和财务成长类共 22 个指标,第二篇分析财务质 量、价量和分析师预期三类共 18 个指标,并且在第二篇报告内分析了 财务相关的因子有效性在财报公布后的衰减规律。 在筛选出有效且稳健的因子的基础上,第三篇建立多因子综合打分的选 股模型,依据不同因子的有效性和稳健性赋予不同的权重,然后根据综 合得分构建股票组合,通过回溯历史,检验模型效果。 1. 本报告的创新之处 本篇报告作为多因子选股系列研究的第一篇,分析和测算了估值类和财 务成长类共 22 个指标的有效性和稳健性,有以下创新之处。 1.1. 专注于挖掘有效因子 本报告专注于单因子分析,通过多角度和更细致的分析和测算挖掘出最 有效和稳健的因子。由于只做单因子分析,暂时不做因子间的比较和综 合分析,不需考虑因子的同质性或共线性等,因此我们测算了各种意义 相近的指标,如 PE 和不含非经常损益的 PE,财务指标的单季、同比、 TTM 增长率等,这样可以更好的挖掘出最具代表性和最有效的因子。 1.2. 提出了更严格和更全面的度量因子有效性的方法 通过多角度、更严格的方法度量因子有效性和稳健性,确保了分析结果 不受数据的偶然巧合所影响。在做单因子分析时,我们将股票池按因子 大小排序,分为五档,通过分析各档股票的表现差异、以及各档的平均 收益排名与因子排名的相关性,来度量和分析因子的有效性。目前绝大 多数的研究中,分析因子有效性时,都是比较因子排名靠前 X%与靠后 X%的差异,我们认为这样做有以下两点不足之处:首先,X 取多少存 在较大的主观性,而且在确定 X 的最优取值时可能会产生过度数据挖掘 的问题;其次,单凭最前和最后的 X%的表现差异,而忽略中间大部分 个股表现的信息,由此选取的有效因子可能不够可靠和稳健。 1.3. 分析了不同股票池和不同市场环境下各因子的有效性 请务必阅读正文之后的免责条款部分 3 of 39
数量化专题报告 为了避免有些指标(如估值类)在大盘股与小盘股之间存在整体性的差 异,可比性不高,我们分别在 HS300 成分股和 ZZ500 成分股中进行因 子的有效性分析。进一步,为了提高各个指标的可比性,我们在 HS300 和 ZZ500 成分股中分别按周期与非周期行业划分,由此分为了四个股票 池,分别进行单因子分析。另外,考虑到因子的有效性跟所处的市场环 境有关,我们统计和分析了不同市场阶段(牛市、熊市、震荡市)的因 子有效性,为构建多因子选股模型和指导实际投资提供更全面的信息。 1.4. 更符合实际的数据处理方式 很多因子指标需要使用到财务数据,而上市公司财务报表的公布时间有 一定的滞后和差异,在常用数据库(如 wind)中,历史的财务数据是按 报告期更新的,如二季报的财务数据都是在 6 月 30 日更新的,而其二 季报公布的时间肯定在 6 月 30 日之后。因此,直接使用这些历史数据 测算不够贴近实际,我们对数据进行了合理处理,确保在历史的每个时 点只使用当时可以得到的数据信息,并使指标值在个股间具有较好的可 比性。 2. 研究思路 2.1. 研究框架 图 1 单因子分析框架 1. 将股票池按因 子排序分档 单因子 各 20% 2.计算各档平均收益 Ri ,并按收益大小得到 各档排序号 Ni 平均收益 收益排名 大 小 一档 二档 三档 四档 五档 R1 R2 R3 R4 R5 N1 N2 N3 N4 N5 3. 分析因子的 有效性 计算并分析一档与五档 的收益差:R1- R5 计算并分析一二档与四 五档的平均收益差: (R1+ R2)/2- (R4+R5)/2 计算因子排序与收益排 序的相关性: CORREL([1,2,3,4,5],[N1, N2,N3,N4,N5]) 资料来源:国泰君安证券研究 2.2. 因子选取 2.2.1. 因子选取说明 我们选取了五大类因子:估值类(7 个指标)、财务成长类(15 个指标)、 财务质量类(10 个指标)、价量类(6 个指标)、分析师预期类(2 个指 标),本篇报告分析估值类和财务成长类共 22 个。具体指标如表 1 所示: 请务必阅读正文之后的免责条款部分 4 of 39
表 1 估值类和财务成长类指标 数量化专题报告 因子指标 名称 估 值 类 财 务 成 长 类 说明 市值/最近 4 个季度归属母公司净利润 市值/最近 4 个季度扣除非经常收益的净利润 PE/最近 4 个季度净利润增长率 市值/最近 4 个季度营业收入 市值/最近 4 个季度净现金流量 市值/当期净资产 剔除货币资金后的企业价值/最近 4 个季度税息折旧及摊销前利润 当年单季度营业收入/上年同期营业收入-1 当年当期营业收入/上年同期营业收入-1 营业收入增长率-单季 营业收入增长率-同比 营业收入增长率-1 年(TTM) 最近 4 个季度营业收入/上期 4 个季度营业收入-1 净利润增长率-单季 净利润增长率-同比 PE(TTM) 市盈率 PEcut(TTM) 扣除非经常损益的市盈率 PEG(TTM) 市盈率相对盈利增长率 PS(TTM) 市销率 PCF(TTM) 市现率 PB 市净率 EV/EBITDA 企业价值倍数 RG-S RG-P RG-TTM NPG-S NPG-P NPG-TTM 净利润增长率-1 年(TTM) CFG-S CFG-P CFG-TTM 经营性现金流增长率-1 年(TTM) 最近 4 个季度经营性现金流/上期 4 个季度经营性现金流-1 ROEG-S ROEG-P ROEG-TTM ROE 增长率-1 年(TTM) ROAG-S ROEG-P ROEG-TTM ROA 增长率-1 年(TTM) 当年单季度归属母公司利润/上年该季度归属母公司利润-1 当年当期归属母公司利润/上年同期归属母公司利润-1 最近 4 个季度归属母公司利润/上期 4 个季度归属母公司利润-1 当年单季度经营性现金流/上年该季度经营性现金流-1 当年当期经营性现金流/上年同期经营性现金流-1 (本年单季度归属母公司净利润-上年同期归属母公司净利润)/平均总资产 (本年当期归属母公司净利润-上年同期归属母公司净利润)/平均总资产 ROE 增长率-单季 ROE 增长率-同比 ROA 增长率-单季 ROA 增长率-同比 (本年单季度归属母公司净利润-上年该季度归属母公司净利润)/平均净资产 (本年当期归属母公司净利润-上年同期归属母公司净利润)/平均净资产 (最近 4 个季度归属母公司净利润-上期 4 个季度归属母公司净利润)/平均净资产 经营性现金流增长率-单季 经营性现金流增长率-同比 (最近 4 个季度归属母公司净利润-上期 4 个季度归属母公司净利润)/平均总资产 数据来源:国泰君安证券研究 2.2.2. 数据处理说明 测试区间为:HS300 股票池从 2005 年 1 月至 2011 年 6 月;ZZ500 股票 池从 2007 年 1 月至 2011 年 6 月。由于 HS300 与 ZZ500 的成份股在每年 1 月初和 7 月初进行定期调整,因此我们的股票池也每隔半年更新一次。 在计算估值指标和财务指标时,考虑到在实际当中我们无法拿到每个时 点的财务数据,因此使用的是已公布的最近期财务报告的数据。具体而 言,1 月、2 月、3 月用的是上年 3 季报及之前数据;4 月,5 月,6 月, 7 月用的是本年 1 季报和上年年报及之前数据;8 月,9 月用的是本年半 年报及之前数据;10 月,11 月和 12 月用的是本年 3 季报及之前数据。 这样虽有一定时滞,但一方面与实际情况相符,具有可操作性,另一方 面也使指标更具有可比性。 另外,在分析估值类因子时,如遇指标为负值的个股,我们将其剔除。 在计算财务成长类因子时,我们利用如下公式计算指标增长率: 增长率 = (本期指标-上期指标)/abs(上期指标) 这样能够解决上期为负、本期转正的指标的增长率计算问题。 数据全部取自 wind 数据库。 请务必阅读正文之后的免责条款部分 5 of 39
数量化专题报告 2.3. 股票池的划分 2.3.1. 按市值特征 经典的 Fama-French 三因素模型早已表明市值对股票的收益率有显著的 影响,各种主动型投资基金也常常按照投资标的的市值进行风格划分, 而大、小市值股票的估值等指标存在整体性的水平差异,不具备可比性。 因此我们按照市值大小对股票池进行划分。 我们以沪深 300 指数(HS300)成分股做为大市值股票池,以中证 500 指数(ZZ500)的成分股做为中、小市值股票池。这样既做到了以市值 大小对股票进行大致划分,同时,由于这些指数在甄选成份股时不仅考 虑到市值,也考虑到流动性、近期业绩等因素,遇到公司合并、重组停 牌等事项时及时将相关股票剔除,并定期调整、更新成份股。这就相当 于我们的股票池已事先进行了一道清理程序,大大降低选到“黑天鹅”股 票的概率,减小换股时产生的冲击成本,而且明确了我们投资组合收益 的比较基准。 2.3.2. 按行业属性 不同行业的某些财务指标的整体差异性大,可比性不高,因此按行业属 性进一步划分股票池也是有必要的。一般来说,周期类行业与非周期行 业在很多财务指标上具有显著差异,因此我们按周期与非周期对股票池 进行进一步划分。之所以没有把每个行业作为一个股票池是因为如果划 分的过细,一方面可操作性会降低,另一方面容易造成样本数量急剧下 降,统计结果可靠性会降低。 在区分周期与非周期行业的问题上,我们参考了上证周期指数(000063) 与上证非周期指数(000064)的划分方法,根据证监会行业板块,将“金 融”、“金属”、“交通运输”、“采掘业、”“房地产”五大类行业放在周期性 行业里,其他行业放在非周期性行业里。 2.4. 分析因子有效性 2.4.1. 因子有效性的度量 (1)测算因子有效性的步骤 Step1 将股票池里的样本股票按待测因子按由高到低的顺序分成五档,各 占 20%。分别计算每一档的月平均收益率。 Step2 计算两次月平均收益率差,分别是: TOP 20%(第一档)- BOTTOM 20%(第五档), TOP 40%(第一、二档)- BOTTOM 40%(第四、五档)。 Step3 计算上述收益率差的平均值。如果平均值为正,则该因子的影响总 请务必阅读正文之后的免责条款部分 6 of 39
数量化专题报告 体是正向的,即因子值越大收益趋于越大;如果平均值为负,则反之。 Step4 计算每个因子的有效性。有效性的计算方法如下: 正向(负向)因子的有效性=月均收益率差为正(负)的月份数/总月份数。 Step5 根据每个月份五档的因子排名与对应的平均收益率排名,计算其 相关系数以及显著性检验的 P 值。 (2)度量因子有效性的标准 首先,看 TOP 20%组合与 BOTTOM 20%组合的月平均收益率差是否有 显著差异,如果有显著差异,说明该因子具有一定的区分度。同时,有 效性比较高,才能说明该因子效果的稳健性比较好,才能确保依据该因 子选取的组合胜率比较高。 其次,看 TOP 40%组合与 BOTTOM 40%组合的月平均收益率差是否显 著且有效性是否较高。 最后,观察五档组合的因子排名与其下期收益率排名的相关性是否显 著,越显著说明因子对收益的影响越确定。 这样从三个方面分析因子的有效性和稳健性,很大程度上确保了分析结 果不受数据的偶然巧合所影响。 2.4.2. 按市场环境对因子有效性进行分析 考虑到不同的市场阶段和环境下,投资者的关注点或关注的指标有很大 不同,指标的有效性也可能会表现出较大的差异,因此我们统计和分析 了不同市场阶段(牛市、熊市和震荡市三种)的因子有效性,为构建多 因子选股模型和指导实际投资提供更全面的信息。 05 年以来 HS300 的走势与 ZZ500 的走势并不完全同步,我们对市场阶 段的划分如下: HS300: 牛市:2006 年 4 月-2007 年 10 月,2008 年 11 月-2009 年 7 月 震荡:2005 年 1 月-2006 年 3 月,2009 年 8 月-2011 年 6 月 熊市:2007 年 11 月-2008 年 10 月 ZZ500: 牛市:2007 年 1 月-2007 年 9 月,2008 年 11 月-2010 年 10 月 震荡:2010 年 11 月-2011 年 6 月 熊市:2007 年 10 月-2008 年 10 月 3. 主要实证结果和分析 3.1. 单因子有效性分析 请务必阅读正文之后的免责条款部分 7 of 39
数量化专题报告 3.1.1. 市盈率 PE(TTM) 总体来看,五档累计收益图基本呈现出 PE 较低的组合收益率较高的特 征。值得注意的是,在 HS300 成份股中,最靠前的是第 4 档、而非第 5 档的股票,且其收益率大幅领先其他组,也就是说并不是 PE 最低的表 现最好,而是 PE 较低的表现较好。 具体来看:从市值特征看,PE 在 HS300 和 ZZ500 股票池中表现出的有 效性规律相似;从行业属性看,PE 在非周期股票池中的有效性明显强于 周期类;从市场环境看,PE 在牛市表现更好。 图 2:PE 五档累计收益-HS300 图 3:PE 五档累计收益-ZZ500 PE 一档 二档 三档 四档 五档 HS300平均 9 8 7 6 5 4 3 2 1 0 1 0 5 0 0 2 5 0 5 0 0 2 9 0 5 0 0 2 1 0 6 0 0 2 5 0 6 0 0 2 9 0 6 0 0 2 1 0 7 0 0 2 5 0 7 0 0 2 9 0 7 0 0 2 1 0 8 0 0 2 5 0 8 0 0 2 9 0 8 0 0 2 1 0 9 0 0 2 5 0 9 0 0 2 9 0 9 0 0 2 1 0 0 1 0 2 5 0 0 1 0 2 9 0 0 1 0 2 1 0 1 1 0 2 5 0 1 1 0 2 3.5 3 2.5 2 1.5 1 0.5 0 PE 一档 四档 二档 五档 三档 ZZ500平均 1 0 7 0 0 2 4 0 7 0 0 2 7 0 7 0 0 2 0 1 7 0 0 2 1 0 8 0 0 2 4 0 8 0 0 2 7 0 8 0 0 2 0 1 8 0 0 2 1 0 9 0 0 2 4 0 9 0 0 2 7 0 9 0 0 2 0 1 9 0 0 2 1 0 0 1 0 2 4 0 0 1 0 2 7 0 0 1 0 2 0 1 0 1 0 2 1 0 1 1 0 2 4 0 1 1 0 2 7 0 1 1 0 2 数据来源:国泰君安证券研究 数据来源:国泰君安证券研究 股票池 HS300 总体 HS300 周期 HS300 非周期 ZZ500 总体 ZZ500 周期 市场 阶段 总体 牛市 熊市 震荡 总体 牛市 熊市 震荡 总体 牛市 熊市 震荡 总体 牛市 熊市 震荡 总体 牛市 表 2 PE 有效性分析 月均收益率差 一档-五档(%) -0.76 -2.07 0.20 -0.10 0.15 -1.59 -0.83 1.75 -1.29 -2.62 0.03 -0.72 -0.81 -1.25 0.23 -0.71 -0.98 -1.37 有效性 49% 50% 67% 53% 49% 50% 58% 50% 59% 64% 42% 55% 52% 58% 62% 50% 44% 48% 一二档-四五档(%) -0.79 -2.13 0.21 -0.11 -0.09 -0.84 -0.74 0.67 -1.04 -2.41 0.01 -0.36 -0.73 -1.08 -0.10 -0.46 -0.54 -0.83 有效性 55% 64% 58% 53% 51% 61% 58% 58% 63% 75% 42% 55% 54% 60% 46% 50% 54% 55% 相关系数 因子排名与收益率排名相关性 P 值 0.11 0.02 0.41 0.45 0.63 0.24 0.45 0.45 0.01 0.00 0.34 0.61 0.04 0.00 0.90 0.88 0.86 0.97 -0.08 -0.20 0.11 -0.06 -0.02 -0.10 -0.10 0.06 -0.14 -0.28 -0.13 -0.04 -0.12 -0.22 0.02 -0.03 0.01 0.00 请务必阅读正文之后的免责条款部分 8 of 39
分享到:
收藏