o
深度学习之股指期货日内交易策略
大数据深度学习系列之一
报告摘要:
金融大数据下的机器学习
作为大数据时代机器学习的革命性成果,深度学习自提出以来迅速发
展,在互联网领域掀起了一股方兴未艾的研究和应用热潮。谷歌、微软、
IBM、百度等 IT 巨头们纷纷厉兵秣马,在深度学习领域投入人力物力;不
负众望,深度学习也解决了一个又一个难题,在语音识别和图像识别等机
器学习领域取得了众多突破。
深度学习高频股价预测模型
从市场微观结构的角度来说,股票价格的形成和变化是由买卖双方的
交易行为决定的,因此,对高频市场行情数据的挖掘有可能获得对未来股
票价格走势的有预测能力的模式。
本报告通过样本内大量历史数据训练深度学习预测模型,对 1 秒钟高
频下的股指期货价格涨跌进行预测 。该预测模型的样本外的准确率超过
73%,表现不俗。
深度学习股指期货交易策略
基于深度学习股价预测模型对股票价格变化的预测,本报告提出了股
指期货的日内交易策略。该交易策略自 2013 年以来累积收益率达 99.6%,
年化收益率为 77.6%,最大回撤为-5.86%。
结论
通过股指期货高频价格预测模型的实证研究,本报告验证了深度学习
这一大数据时代的机器学习利器在股票价格预测上的有效性。并基于预测
模型提出了股指期货交易策略,取得了良好的效果。
金融工程|专题报告
2014 年 6 月 18 日
证券研究报告
图 1 深度学习股指期货交易策略累积
收益曲线
Table_Author
分析师: 安宁宁 S0260512020003
0755-23948352
ann@gf.com.cn
识别风险,发现价值 请务必阅读末页的免责声明
1 / 24
金融工程|专题报告
目录索引
一、机器学习掘金量化投资 ................................................................................................. 4
二、深度学习介绍 ................................................................................................................ 5
(一)深度学习:机器学习的新浪潮 ............................................................................ 5
(二)模型起源 ............................................................................................................ 7
(三)深层模型结构 ..................................................................................................... 8
(四)人工神经网络 ..................................................................................................... 9
(五)自编码器和深度网络 ........................................................................................ 12
(六)大数据优化问题的迭代算法 ............................................................................. 14
三、交易策略 ..................................................................................................................... 16
四、实证分析 ..................................................................................................................... 17
五、总结与讨论 ................................................................................................................. 22
识别风险,发现价值 请务必阅读末页的免责声明
2 / 24
金融工程|专题报告
图表索引
图 1:机器学习的一般流程 ................................................ 6
图 2:视觉系统的层级结构 ................................................ 8
图 3:深度学习的层级结构 ................................................ 8
图 4:神经元示意图 ..................................................... 10
图 5:逻辑函数输入输出图 ............................................... 10
图 6:神经网络示意图 ................................................... 11
图 7:深度学习示意图 ................................................... 13
图 8:自编码器示意图 ................................................... 13
图 9:降噪自编码器示意图 ............................................... 14
图 10:深度学习股指期货交易策略 ........................................ 17
图 11:日内股指期货行情及做多做空信号(2014 年 4 月 1 日) ................ 20
图 12:日内股指期货行情及做多做空信号(2014 年 4 月 3 日) ................ 21
图 13:样本外累积收益曲线 .............................................. 22
表 1:深度学习股价预测特征选取 ......................................... 18
表 2:深度学习股价预测预测性能 ......................................... 19
表 3:建仓平仓点位及收益明细(2014 年 4 月 1 日) ......................... 20
表 4:建仓平仓点位及收益明细(2014 年 4 月 3 日) ......................... 21
表 5:不同参数下的交易策略样本外表现 ................................... 23
识别风险,发现价值 请务必阅读末页的免责声明
3 / 24
金融工程|专题报告
一、机器学习掘金量化投资
最早的量化投资系统至少可以追溯到 1971 年,一个叫做约翰·麦奎恩(John McQueen)
的电子工程师利用美国富国银行的信托投资平台建立的第一个定量投资系统。历经 40
多年,量化投资迅速发展,目前,美国超过 60%的交易是由电脑进行的。
在这 40 多年的发展历程中,一批从象牙塔里走出来并投身金融实务的科学家在量
化投资领域里成为了耀眼的明星。最耀眼的两颗当属詹姆斯·西蒙斯(James Simons)
和大卫·肖(David Shaw)。
西蒙斯向来被看成是量化投资中的传奇人物。他依靠数学模型和计算捕捉市场机会
并做出交易决策。自基金成立后的 1989 到 2007 年,该基金的平均年收益率高达 35.6%,
而股神巴菲特在同期的平均年回报大约为 20%。即使在 2007 年次债危机爆发当年,基
金投资回报高达 73%,而 2008 年时,基金更是上涨了 80%,西蒙斯本人也因此被誉为“最
赚钱基金经理”。
大卫·肖同样以神秘的“黑盒子”和科技手段观察整个金融市场。与多数华尔街大
鳄不同,在资本市场“兴风作浪”只算得上肖的副业,一直以来他都将生物及计算机科
学研究作为人生第一要务。1980 年,肖获得斯坦福大学计算机博士学位,之后成为哥
伦比亚大学计算生物与生物技术中心高级研究员。在哥大期间,肖领导了庞大并行计算
研究。1986 年,肖加入摩根士丹利,担任自动分析交易技术部门的副总裁,两年后出
来单干,成立了以自己名字命名的对冲基金公司 D. E. Shaw。相关数据显示,该基金
自 1988 年成立后,年均回报率达 20%左右,而其发展巅峰时的交易量可以占到整个纽
约证券交易所的 5%。大卫·肖也因此有了“定量之王”的美誉。
众所周知,西蒙斯的文艺复兴科技公司聘请了大量“火箭专家”。事实上,西蒙斯
本人就是一位很著名的数学家,与数学大师陈省身合作搞出了很有名的 Chern-Simons
几何定律。公司的 200 多名员工中,超过 70 位拥有数学、物理学或统计学博士头衔,
其中有提出了著名的最大熵迭代算法的达拉皮垂兄弟(S. Della Pietra & V. Della
Pietra)和第一个提出机器翻译统计模型的布朗(Peter Brown)。这些都是当时机器
学习领域红极一时的算法和模型的提出者。
与文艺复兴科技公司类似,D. E. Shaw 公司有一支由数学天才和科学家组成的精
英团队,在 1700 名员工中,有十分之一的人获得了博士学位。浓厚的科学研究氛围令
D. E. Shaw 的运作较其他华尔街金融机构更为神秘,该公司的大部分投资都基于复杂
的数学模型,旨在找出隐藏的市场趋势或定价异常,并从细微差异和瞬间变化中寻求丰
厚的投资回报。
时过境迁,离西蒙斯和大卫·肖开始投身金融界也过去了二十多年,20 世纪 80 年
代曾取得巨大成功的人工神经网络在 90 年代就已经被支持向量机等新的统计学习模型
识别风险,发现价值 请务必阅读末页的免责声明
4 / 24
金融工程|专题报告
掩盖光芒。Boosting,最大熵方法(如 Logistic Regression),随机森林(Random Forest)
等也一度站上舞台,一度成为机器学习研究与应用的潮流。伴随着机器学习领域的发展
进步,文艺复兴科技公司和 D. E. Shaw 公司等数量化对冲基金一定也在不断吸收新的
机器学习模型,探索新的交易策略。
时至今日,随着计算机科学与技术的蓬勃发展,存储成本的降低,计算速度的提高,
人们越来越关注“云计算”、“大数据”这些热门词汇。金融市场的数据量也越来越多
——单单 A 股市场就有近 2000 只股票,光考虑以秒为单位的高频数据,每个交易日就
会产生两千多万个新的数据样本。如何从中“数据海洋”中提取有用的信息,来帮助投
资者获得超额收益呢?深度学习或许会是一种有效的手段。
二、深度学习介绍
(一)深度学习:机器学习的新浪潮
2012 年 6 月,《纽约时报》披露了“谷歌大脑”(Google Brain)项目,吸引了公
众的广泛关注。这个项目是由著名的斯坦福大学机器学习教授吴恩达(Andrew Ng)和
在大规模计算机系统方面的世界顶尖专家 Jeff Dean 共同主导,用 16000 个 CPU Core
的并行计算平台训练一种称为“深层神经网络”的机器学习模型,在语音识别和图像识别
等领域获得了巨大的成功。在谷歌的一次公开展示中,该大脑从 1 千万个随机挑选的没
有经过标注处理的 YouTube 视频中,自动识别出了猫脸。不久之后,谷歌收购了深度学
习的教父级人物——加拿大多伦多大学教授 Geoffrey Hinton 创建的人工智能研究机构
DNNresearch,继续增大在深度学习领域的投入。
微软和 IBM 的研究人员使用深度学习在语音识别上也取得了巨大进展。2012 年 11
月,微软首席科学家 Richard Rashid 在中国天津的一次活动上公开演示了一个全自动
的同声传译系统,讲演者用英文演讲,后台的计算机一气呵成自动完成语音识别、英中
机器翻译,以及中文语音合成,效果非常流畅。后面支撑的关键技术就是深度学习。根
据微软和谷歌的报告,用深度学习改进传统的隐马尔科夫语音识别模型,将语音识别的
错误率相对降低了 30%。同时,深度学习技术在图像识别领域取得惊人的效果,2012 年
在业界著名的 ImageNet 评测上将错误率从此前的最好成绩 26%降低到 15%。也是在这
一年,深度学习还被应用于制药公司的药物活性预测问题,并获得世界最好成绩。
另一家美国社交网络巨头 Facebook 也在 2013 年下半年组建了深度学习研究小组,
用来分析预测用户的行为习惯。Facebook 此前已经使用传统的机器学习算法来给用户
定向投递新闻和广告(谷歌,亚马逊,百度,阿里巴巴等互联网企业也正在使用这种针
对具体用户的“推荐系统”),而今他们寄望于通过深度学习来获得更好的效果。事实
识别风险,发现价值 请务必阅读末页的免责声明
5 / 24
金融工程|专题报告
上,在此前著名的 Netflix(奈飞公司,全球最大的流媒体播放服务提供商,《纸牌屋》
的出品方)电影推荐系统比赛中,基于深度学习的算法就一举夺魁。
国内的互联网 IT 企业也开始了在深度学习领域的投入和研发。2013 年 1 月,在百
度的年会上,创始人兼 CEO 李彦宏高调宣布要成立深度学习研究院,这是百度成立十多
年以来第一次成立研究院。同年,国内语音识别技术的领军企业科大讯飞也将深度学习
作为未来研发的重点目标。
2013 年 4 月,《麻省理工学院技术评论》(MIT Technology Review)杂志将深度
学习列为 2013 年的十大突破性技术之首。
近年来深度学习相关的研究和应用如此火爆,那么,深度学习究竟是一种什么样的
学习方式呢?
机器学习的目标有图像识别、语音识别、自然语言理解、股价预测、天气预测、基
因表达、内容推荐等等。以图象识别为例,目前我们通过机器学习去解决这些问题的思
路一般是如图 1 所示。
图1:机器学习的一般流程
数据来源:广发证券发展研究中心
从开始的通过传感器(例如 CMOS)来获得数据。然后经过数据预处理、特征提取、
特征选择,再到推理、预测或者识别。最后一个部分“推理、预测、识别”,也就是我
们通常所说的机器学习的部分,主要是通过数学和统计方法来建立学习模型。而中间的
三部分概括起来就是“特征表达”。良好的特征表达,对最终算法的准确性起了非常关
键的作用,而整个机器学习系统建立时主要的计算和测试工作都耗在这一大部分。但实
际中,这一块一般都是人工完成的,也就是靠人工提取特征。在股价预测中,类似的流
程就是我们定义了很多的技术指标,即机器学习中的特征,比如移动平均线、布林线、
相对强弱指标等;然后根据我们要解决的问题选择合适的特征来建立预测规则(模型)。
手工地选取特征是一件非常费力、启发式(利用专业知识来选取特征)的方法,能
不能选取好很大程度上靠经验和运气,而且它的调节需要大量的时间。既然手工选取特
征不太好,那么能不能自动地学习一些特征呢?答案是肯定的!深度学习就是用来干这
个事情的。
识别风险,发现价值 请务必阅读末页的免责声明
6 / 24
(二)模型起源
金融工程|专题报告
很多机器学习模型受到生物学方面的启发,比如说遗传算法,粒子群算法,蚁群算
法等。深度学习也与生理医学上的发现有关。
1981 年的诺贝尔医学奖颁发给了 David Hubel 和 Torsten Wiesel,以及 Roger
Sperry。前两位的主要贡献,是“发现了视觉系统的信息处理”,即 Hubel-Wiesel 模
型。1958 年,Hubel 和 Wiesel 在约翰霍普金斯大学研究瞳孔区域与大脑皮层神经元的
对应关系。他们在猫的后脑头骨上,开了一个 3 毫米的小洞,向洞里插入电极,测量神
经元的活跃程度。然后,他们在小猫的眼前,展现各种形状、各种亮度的物体。并且,
在展现每一件物体时,还改变物体放置的位置和角度。他们期望通过这个办法,让小猫
瞳孔感受不同类型、不同强弱的刺激。之所以做这个试验,目的是去证明一个猜测:位
于后脑皮层的不同视觉神经元,与瞳孔所受刺激之间,存在某种对应关系。一旦瞳孔受
到某一种刺激,后脑皮层的某一部分神经元就会活跃。经历了很多天反复的枯燥的试验,
Hubel 和 Wiesel 发现了一种被称为“方向选择性细胞”(Orientation Selective Cell)
的神经元细胞。当瞳孔发现了眼前的物体的边缘,而且这个边缘指向某个方向时,这种
神经元细胞就会活跃。
这个发现激发了人们对于神经系统的进一步思考:脑神经系统具有丰富的层次结构。
神经-中枢-大脑的工作过程,或许是一个不断迭代、不断抽象的过程。这里的关键词有
两个,一个是抽象,一个是迭代。从原始信号,做低级抽象,逐渐向高级抽象迭代。人
类的逻辑思维,经常使用高度抽象的概念。如图 2 所示,从原始信号摄入开始(瞳孔摄
入像素),接着做初步处理(V1 层:大脑皮层某些细胞发现边缘和方向),然后抽象
(V2 层:大脑判定,眼前的物体的形状,是圆形的),然后进一步抽象(V3 层:大脑
进一步判定该物体是人脸)。换句话来说,人的视觉系统的信息处理是分级的。高层的
特征是低层特征的组合,从低层到高层的特征表示越来越抽象,越来越能表现语义或者
意图。而抽象层面越高,存在的可能猜测就越少,就越利于分类。例如,单词集合和句
子的对应是多对一的,句子和语义的对应又是多对一的,语义和意图的对应还是多对一
的,这是个层级体系。
识别风险,发现价值 请务必阅读末页的免责声明
7 / 24
图2:视觉系统的层级结构
金融工程|专题报告
数据来源:广发证券发展研究中心
(三)深层模型结构
深度学习是模拟大脑皮层的 Hubel-Wiesel 模型,采用一层层“抽象化”的方式来
对数据或者信号进行表达。类似于大脑皮层对图像的分辨,深度学习模型首先从原始信
号(类似于人脸识别系统中的像素)中分离出低层的特征(类似人脸识别系统中物体的
边),然后从低层特征中获取高一层的特征(类似于人脸识别系统中由边组成的轮廓),
然后获得更高一层的表达(类似人脸识别中的人脸),最后在高层特征上建立起分类器,
获得模型的预测输出。
图3:深度学习的层级结构
数据来源:广发证券发展研究中心
识别风险,发现价值 请务必阅读末页的免责声明
8 / 24