金
融
工
程
[Table_MainInfo]
[Table_Title]
2017.07.11
数
量
化
专
题
报
告
证
券
研
究
报
告
基于深度组合的选股策略
——数量化专题之九十七
刘富兵(分析师)
殷明(研究助理)
021-38676673
021-38674637
liufubing008481@gtjas.com
yinming@gtjas.com
证书编号 S0880511010017
S0880116070042
本报告导读:
本报告围绕“深度组合”的理念,阐述了如何将深度学习的基本理念借鉴到选股研究
中。我们发现,通过深度学习方法提取的非线性特征和传统的风险模型选股具有良好
的互补性质,从原理上讲,两者也是相辅相成的。深度组合虽然不是方法论上的创新,
却从另一个角度解释了价格信息中蕴含的规律,并且其表现在过去 7 年中比传统动量
策略更强劲。
摘要:
深度学习在语音、视频、自然语言处理等领域的成功使得越
[Table_Summary]
来越多的投资者开始尝试将其运用到投资中,然而,更高的
噪音、更复杂的影响因素使得很多经典算法并不适用。本篇
报告借鉴国外的“深度组合”理念,尝试将深度学习的基本
理念使用到选股研究中。
本篇报告首先介绍了深度组合概念,然后从理论上解释了深
度组合并不是方法论的创新,而是对市场不同角度的解读。
之后我们对深度组合的构建方法做了详细介绍,并通过在沪
深 300 上的选股实证为例,进一步介绍了数据处理的细节。
总体来说,深度组合的构建包含三个步骤,即通过自编码网
络学习原始数据特征,转化为分类问题对 T+1 时期进行预测,
通过指标验证组合构建的合理性并确定持仓方案。
为了解决传统的神经网络投资的“黑箱”问题,我们通过自
编码过程中的损失函数作为指标,对策略进行了优化。一方
面,对选股池中的股票,只选取置信度高的个股进行处理;
另一方面,通过该指标判断策略是否失效。我们通过实证分
析中的指标检验证明了该指标确实和策略收益是高相关的,
并且不存在滞后性,从而使得策略在出现回撤时有章可循。
基于上述思路,我们构建了沪深 300 股票池中的选股策略,
该策略从 2010 年中至 2017 年中的七年时间里,在 8.33%的
最大回撤下获得约 18.37%的年化收益,领先于传统的动量策
略,并且,策略在今年取得了 7.113%的超额收益。
根据检验指标,我们对策略进行了进一步优化。优化的策略
从收益端和风险端对原策略均有提升,进一步证实了指标的
可靠性。
请务必阅读正文之后的免责条款部分
金融工程
金融工程团队:
刘富兵:(分析师)
电话:021-38676673
邮箱:liufubing008481@gtjas.com
证书编号:S0880511010017
陈奥林:(分析师)
电话:021-38674835
邮箱:chenaolin@gtjas.com
证书编号:S0880516100001
李辰:(分析师)
电话:021-38677309
邮箱:lichen@gtjas.com
证书编号:S0880516050003
孟繁雪:(分析师)
电话:021-38675860
邮箱:mengfanxue@gtjas.com
证书编号:S0880517040005
蔡旻昊:(研究助理)
电话:021-38674743
邮箱:caiminhao@gtjas.com
证书编号:S0880117030051
殷明:(研究助理)
电话:021-38674637
邮箱:yinming@gtjas.com
证书编号:S0880116070042
叶尔乐:(研究助理)
电话:021-38032032
邮箱:yeerle@gtjas.com
证书编号:S0880116080361
相关报告
[Table_Report]
《板块及行业指数价格分段研究》2017.07.05
《基于信息冲击视角的盈余公告效应研究》
2017.07.04
《回撤控制下的最优化大类资产配置策略》
2017.07.03
《基于短周期价量特征的多因子选股体系》
2017.06.15
《基于短周期价量特征的多因子选股体系》
2017.06.01
数量化专题报告
目录
1. 引言 ........................................................................................................................................... 3
2. 深度组合理念.......................................................................................................................... 4
2.1. 深度组合的基本概念 ..................................................................................................................................................... 4
2.2. 深度组合的构造 .............................................................................................................................................................. 5
2.3. 隐含假设 ............................................................................................................................................................................ 5
3. 深度组合的理论基础及其不同视角 ................................................................................. 6
3.1. Markowitz 和 Black-Litterman 的视角 ........................................................................................................................ 6
3.2. 信息论的视角 .................................................................................................................................................................. 7
3.3. 传统多因子模型的视角 ................................................................................................................................................ 7
4. 基于深度组合的选股策略 ................................................................................................... 8
4.1. 自编码学习隐含特征 ..................................................................................................................................................... 8
4.2. 转化为经典分类问题 ................................................................................................................................................... 10
4.3. 模型选择及验证 ............................................................................................................................................................ 10
4.4. 构造深度组合的一般方法 ......................................................................................................................................... 11
5. 沪深 300 选股实证分析 ...................................................................................................... 11
5.1. 数据准备和预处理 ....................................................................................................................................................... 11
5.2. 选股策略构建 ................................................................................................................................................................ 13
5.3. 归因分析 .......................................................................................................................................................................... 16
5.4. 策略指标分析 ................................................................................................................................................................ 17
5.5. 利用损失函数优化策略 .............................................................................................................................................. 18
6. 总结与展望 ............................................................................................................................ 19
6.1. 深度组合选股方法的优势和不足 ............................................................................................................................ 19
6.2. 深度组合方法的未来应用 ......................................................................................................................................... 20
请务必阅读正文之后的免责条款部分 2 of 21
数量化专题报告
1. 引言
量化选股研究一直是量化领域经久不衰的课题,其本质是在某个特定的
股票池内,通过寻找某些个股优于一般股票的“性质”,以这些性质为
基础构造组合,从而得到长期跑赢基准的策略。这里的“性质”传统意
义上被称为“因子”,并由此衍生出一系列研究,包括如何挖掘具有稳
定超额收益的因子,如何通过因子构造最优组合,如何平衡收益、风险、
成本等投资因素,等等。然而,随着传统风险管理模型的兴起,投资者
会发现挖掘新的具有“边际收益”的因子越来越难,同时,已知因子的
收益也随着市场风格变换越来越不稳定,有些甚至渐渐失效。因此,在
这个时点,我们有必要放开思路,重新审视因子选股。
与此同时,深度学习在包括视觉图像、音频信号处理、自然语言处理甚
至自动驾驶等诸多传统领域都获得了巨大的成功,“人工智能”一词已
经代替过去泛滥的“大数据”一词,一跃成为投资者们新的宠儿,甚至
有人开始怀疑不久后会出现“投资机器人”,取代基金经理的工作。然
而,当国内外诸多学者将深度学习算法应用到投资领域后发现,远高于
传统领域的噪音和变量都使得深度学习在投资领域的研究并不那么容
易成功。但是,这并不是宣告了深度学习的死刑,相反,近年来越来越
多的研究者开始涉足该领域,在美国,越来越多的对冲基金开始引入人
工智能的研究,甚至在国内,也开始有一批通过深度学习算法获得稳定
超额收益的尝试涌现出来。
深度组合和传统的多因子体系不同,它使用深度神经网络训练出的因子
进行组合构造,其最大的不同点就是无论是因子本身还是组合的构建过
程都是非线性的。由于非线性的复杂性,因此这种构造过程需要更多的
参数,更多的数据量支撑。深度学习使得这一切成为可能。本篇报告即
是根据国内外众多的已有研究,综合其理念,并加入了一些自己的思考,
针对因子选股问题进行了一些新的尝试。我们发现,通过这种方式构建
的组合,由于非线性特征的复杂性,其稳定性虽然不能和传统的多因子
选股方法相比,但在一些传统选股方式受挫的年份能够较高的超额收
益,从而对因子选股研究做了有益的补充。具体到实证方面,我们在沪
深 300 内的选股策略可以在 2011 年至今在 8.33%的回撤下跑出 18.37%
的年化超额收益,其中,今年以来超额收益达到 7.11%,最大回撤 1.33%。
本篇报告的结构如下:第二章首先介绍了深度组合的基本概念以及其构
造方法;第三章则从不同的视角对深度组合的概念进行了诠释,这些是
深度组合的理论基础,通过对这些视角的观察,一方面我们能更好的理
解深度组合,另一方面我们也发现,其实这种构建方式并不是方法论上
的创新,其基本思想和传统金融理论完全兼容;第四章开始介绍构建深
度组合的细节算法,包括自编码学习隐含特征以及将选股问题转化为分
类问题来处理,并给出了学习算法的一般方法;第五章我们对沪深 300
选股做了实证分析,并对结果进行了分析和优化;最后,我们总结了深
度组合方法的优势与不足,并对未来研究方向进行了展望。
请务必阅读正文之后的免责条款部分 3 of 21
数量化专题报告
2. 深度组合理念
本章主要介绍深度组合的基本概念,并对如何通过深度神经网络构建深
度组合做一个大致的轮廓式的介绍,从而给读者一个初步印象。第四章
中我们会对本章提到的算法进行详细介绍。
2.1. 深度组合的基本概念
深度组合这个理念首次提出是由 JB Heaton 在其 2016 年 9 月的论文
《Deep Learning in Finance: Deep Portfolios》中提出。文中提出了深度组
合这个概念,但是却并没有对如何构建组合进行详细描述。这里的“组
合”和组合管理中的“组合”含义并不相同,其构建目的是为了预测标
普 500 指数的下一期收益率。但是,通过深度神经网络提取因子的思想
却被和很多其他研究不谋而合。其中,Lawrence Takeuchi 在其论文
《Applying Deep Learning to Enhance Momentum Trading Strategies in
Stocks》就详细描述了如何通过深度组合对传统的动量效应进行增强。
同样,在音频处理领域大热的 LSTM 的算法也被运用到股票时间序列预
测中,Jakob Aungiers 在其论文《LSTM Neural Network for Time Series
Prediction》中详细描述了他所在的对冲基金是如何运用该算法进行投资
的。
然而,本篇报告并不旨在对深度学习本身进行科普性介绍,也不对其算
法及其推导过程进行详细描述。相反,我们希望借鉴海内外已有研究,
结合自己的思考,将深度学习算法中的核心理念运用到选股中,并解决
投资中的实际问题,例如投资者谈“机器学习”而色变的“黑箱问题”,
回测效果好而实际效果差的过拟合问题等。
为了让大家对深度组合有一个大致的了解,这里先简单介绍深度神经网
络的概貌,至于和神经网络相关的细节问题,例如前向后向算法、神经
单元的优化等问题我们不做介绍,具体实施细节属于计算机算法范畴,
可以参考神经网络相关书籍文献。
图 1 深度神经网络示意
请务必阅读正文之后的免责条款部分 4 of 21
数据来源:国泰君安证券研究
数量化专题报告
如图 1 所示,是一个简单的深度神经网络示意图。深度神经网络和传统
的神经网络在结构上并无二致,唯一区别就是字面上的“深度”,即包
含了更多的隐含层。之所以要引入更“深”的结构,深度学习理论已经
作了很详细的介绍,我们不再赘述,但是从投资的角度讲,由于我们每
层的隐含层节点都使用简单的非线性激活函数,因此,通过增加层次,
可以学习出更复杂的特征,或者所谓的非线性“因子”,从而使得网络
的表达能力更强。将我们用于构建深度组合的原始信息作为输入层信息
输入到神经网络中,经过网络一系列的学习过程,输出层输出我们需要
构建组合的信息,整个过程即为深度神经网络构建组合的过程。可以看
到,和传统的多因子组合构建方式不同,我们在整个过程中并未对因子
本身做任何的处理(例如因子检验、因子正交化等),而是希望神经网
络本身帮助我们完成这些任务。下面,我们来说明本文如何通过该网络
构建深度组合。
2.2. 深度组合的构造
本节介绍通过深度神经网络构建组合的基本思路。和传统的多因子选股
体系不同,我们并不是通过个股的线性组合来构建策略,而是通过神经
网络对特征进行提取,并以这些特征给出每只不同股票预期收益率区间
的置信度,根据这些置信度确定组合的构造方式,具体来说步骤如下:
(a) 提取市场原始信息作为输入层数据输入神经网络。例如,如果需要
挖掘个股的价格信息,则可以以个股过去的 T 期的收益率作为原始
数据输入到网络中。本篇报告中,我们希望通过对股票价格序列的
研究,挖掘出价格信息中的隐含规律,因此,神经网络的输入项即
为选股池内每只个股过去 120 日的收益率;
(b) 通过自编码网络学习价格信息蕴含的非线性特征。这部分应用了深
度学习中最基本的算法——自编码来构建价格特征。具体算法在第
四章中详细阐述,其本质是通过一种方式将隐含在时间序列中不同
股票的共同“模式”挖掘出来;
(c) 利用上一步骤提取的特征对 T+1 期的预期收益率进行预测。为了使
得输出项更加清晰,这一步我们将问题转化为传统的分类问题,即
把连续的收益率数值区间化,输出落在不同收益率区间的“概率”,
通过这个概率值,根据不同的投资目标构建相应组合。
2.3. 隐含假设
细心阅读 2.2 节会发现,如果要使用过去时间的价格序列通过深度神经
网络来构建组合,其实隐含了一个非常强的假设,即:
假设:所有已知的因子信息和未知的因子信息都包含在过去的股票价格
中,这些因子可以包括价量因子、财务指标因子、交易模式因子等。
可以看到,这是一个非常强的假设,在现实的市场中基本不可能满足。
请务必阅读正文之后的免责条款部分 5 of 21
数量化专题报告
那么,为什么我们还要提出这个假设呢?因为,如果这个假设成立,通
过深度神经网络对过去时间价格序列的挖掘就是充分的,因为所有因子
都已经包含在价格序列中了,如果策略还无效,那么说明挖掘的特征并
不具有通用性,那么需要重新审视挖掘算法。相反,如果模型失效了,
那么除了算法本身可能的问题外,更大的可能是这个假设并不成立,或
者是在某段时间不成立。因此,我们需要有一个指标判断策略是否失效。
我们在第 4.1 节中详细说明了如何通过一个量化的指标判断模型有效
性。
通过本章阐述的方式,我们可以对个股的价格序列进行最简单的模式挖
掘。考虑到这是我们在深度学习领域尝试的第一篇报告,我们并不打算
使用很复杂的算法对数据本身做更多处理,而是将深度学习的基本理念
应用到选股中,给投资者一个直观的印象,也即通过深度神经网络从价
格序列中挖掘到的规律是否稳定存在,通过该方式构建的策略是否存在
投资者普遍担心的黑箱问题、过拟合问题。这些问题在后续章节中将详
细阐述。
3. 深度组合的理论基础及其不同视角
在我们对深度组合构建算法进行详细阐述之前,有必要从理论上解释这
种方法的合理性和可靠性。考虑到投资者对传统金融学理论的既有理
解,我们试图从传统的金融学理论视角出发,来审视深度组合构建过程。
通过这些审视的过程,我们也可以从不同角度将深度组合的神秘面纱逐
渐掀开,从而能够更好的解释深度组合的核心逻辑及本质。下面,我们
将 分 别 从 Markowitz 的 均 值 -方 差 模 型 、 Sharpe 的 CAPM 模 型 、
Black-Litterman 模型、传统的多因子风险管理模型,以及信息论对信息
传输和处理的角度来说明深度组合和这些理论几乎都是兼容的,也就是
说,深度组合并不是方法论的创新,而只是从不同视角对组合构建进行
了全新的尝试。
3.1. Markowitz 和 Black-Litterman 的视角
根据上文所述,对市场的解读就是特征提取的过程。无论是 Markowitz
的均值方差模型,还是 Sharpe 的 CAPM 模型,再到 APT 模型,他们开
始使用一层线性因子来处理股票价格,直到后来很多学者逐步发现了一
系列的因子,例如价值、动量、流动性等等。其实,这些传统模型都在
通过“特征”提取对市场进行解读。而深度组合也只不过是沿用了这样
的思想,通过自编码的方式,提取出了一些非线性特征而已。
下面我们来说明怎么通过深度组合的框架来解释 Markowitz 的均值方差
模型。均值方差模型其实是通过均值和协方差矩阵进行了“编码”:
请务必阅读正文之后的免责条款部分 6 of 21
TtitXTX11TitTtitTXXXXTXX))((11
数量化专题报告
用统计学术语来说,如果市场收益是具有常数预期收益和协方差的多元
正态分布,则上述的指标已经能足够反应市场特征。相当于我们把 N*T
的观测数据“降维”到了 N 个平均值和 N(N-1)/2<
数量化专题报告
这些特征去预测 T+1 时刻的股票价格,或者预期收益率。也就是说,这
里做了一个假设,即假设我们抽取的这些特征在短时间内不会随着时间
产生变化,从而可以将其外推,用于预测 T+1 期的价格。这些特征在多
因子体系中被称为“因子”,在技术分析研究中被称为“模式”或者“规
律”。也就是说,无论什么研究方法,其实我们都做了一个假设:技术
分析中我们认为价格的“模式”是短期内不变的,多因子体系中我们认
为“因子”的特征是短期内不变的,而深度组合中,相对应的,我们认
为隐含层抽取出的特征是短期内不变的。
从本章的分析不难看出,深度组合其实和传统的金融学理论、多因子模
型都有很多相关之处,它并不是方法论上的创新,而是从不同角度对股
票价格进行了解读。
4. 基于深度组合的选股策略
本章开始,我们对通过深度组合进行选股的核心算法进行阐述。深度组
合的构建过程中主要涉及两个核心过程,即通过自编码学习隐含特征以
及通过学习到的特征预测下一期个股收益。
4.1. 自编码学习隐含特征
自编码算法虽然是深度学习中最经典最基础的算法,但是使用该算法进
行选股研究,不但能有效提取股票过去价格的特征,更能够有效判断在
选股的过程中,是否有足够的置信度将某只股票纳入选股池。具体做法
是,对输入层信息通过某函数 H(X)进行编码,得到隐含层节点的输出。
再通过这些输出通过函数 G(X)进行解码,我们希望经过编码、解码之后
的结果和原信息尽可能相似。下面结合具体实例说明。
图 2 简化的自编码网络示意图
数据来源:国泰君安证券研究
如图 2,是一个简化的自编码网络示意图。图中的神经网络共有三层节
点,其中第一层节点是输入层,输入信息是原始的股票价格信息,这里
我们使用个股 120 日收益率作为输入,记为向量 X。中间层的节点为隐
请务必阅读正文之后的免责条款部分 8 of 21