深度学习在多因子选股交易中的应用研究
作者单位:北方工业大学
学位级别:硕士
导师姓名:吴振信
授予年度:2019年
学科分类:12[管理学] 02[经济学] 0202[经济学-应用经济学] 1201[管理学-管理科学与工程(可授管理学、工学学位)] 020204[经济学-金融学(含∶保险学)]
摘 要:股票的价格受多种因子影响,找到并利用这些因子进行股票选择及投资策略制定,逐渐成为金融投资领域中的热点问题。但是从1990年创建以来,我国A股市场已经积累了海量的股票收益率数据及影响因子数据,难以人为进行选择处理,因此需要借助深度学习模型分析海量因子数据信息,深度挖掘股票收益率与影响因子之间线性和非线性关系,并基于分析结果构建选股交易策略,从而指导投资实践。本文首先从公司价值指标、技术指标和投资者情绪指标三个方面,界定170个明细指标,进而利用GBDT模型进行单因子选股回测,发现只有23个因子选择的股票产生大于零的收益。基于年化收益率、夏普比率等衡量指标对影响因子进行初步筛选,构建备选因子组合,并利用IC值分析方法进行因子筛选,最终构建了包括流通市值在内的19个因子形成多因子组合。结合GBDT模型,进行半年期回测交易,最终获得9.58%的年化收益率,高于同期沪深300指数收益,以及用于对比的六因子组合和八因子组合收益,且选股效果要优于随机森林模型。但是,单模型选股策略存在收益波动率较大、夏普比率偏低等问题。其次,为解决模型预测准确性不足的问题,利用LSTM模型对GBDT模型筛选出的股票池进行深度挖掘,判断股票上涨的可能性。基于双模型多因子选股策略,在半年期的选股交易中,获得31.4%的年化收益率,夏普比率为0.95。说明加入LSTM模型后,预测准确性大幅提高,股票收益率得到较大提升。但是,该策略也存在最大回撤值增加,策略风险上升的问题。最后,为降低策略风险,同时考虑到股票收益率与大盘指数之间呈现正相关关系,当大盘指数下跌时股票收益率有较大可能出现下跌的情形。因此,制定大盘风控策略,从而形成基于“多因子体系构建-股票池筛选-组合预测-风险控制思想的完整选股交易流程。在实证研究中,LSTM对沪深300指数收益率的预测效果较好。在半年期的回测中,策略的年化收益率为30.40%,夏普比率上升到1.01,在策略收益和风险补偿方面得到较大提升,整体效果优于跟踪止损策略。