第七届挑战赛A2-基于风格轮动和集成学习的多因子选股投资策略研究

发布时间:2019-08-08 作者:BdRace 浏览量:1917

摘要:

我国金融市场日渐成熟,在大数据和信息化的时代特征下,国内市场的量化产品比重逐渐上升,量化投资的方式能够获得超额收益,量化投资的理念也获得了更多投资者认可,因此越来越多地被使用。量化选股是量化投资的主要内容之一,而多因子模型又是量化选股模型中应用最广泛的一种,经过国内外多年的研究发展,已经成为量化投资中比较成熟的、系统的理论,近年来在我国资本市场有着良好的发挥。风格轮动也是量化选股的重要组成部分,其中风格现象又主要包括成长、价值风格轮动和大盘、小盘风格轮动两种,本文针对大小盘风格轮动进行建模分析。就目前而言,我国的量化选股存在着策略单一、业绩分化等缺点。因此,探寻与挖掘新的量化选股方式,推动量化投资的发展显得尤为重要。

从以往的研究来看,国内的大小盘轮动现象比较明显,风格收益差较大,如果能够在合适的时间进行选择恰当的股票池,则能够获得较高的投资收益。基于此,本文就传统的量化选股方法进行了改进,并针对“泰迪杯”比赛涉及的问题进行相应解决,本文的解决思路如下:

针对问题一,首先通过夏普比率与手动筛选相结合筛选因子,计算单因子选股策略对应的夏普比率,筛选出使得夏普比率大于1的因子,并根据经济意义和

金融理论手动筛选,将夏普比率小于1但是经济意义较为重要的变量也保存在候选因子中;再通过AdaptiveLasso进行因子筛选;最后通过相关性分析进行筛选,得到最终的既具有经济意义又富含预测能力的因子。

针对问题二,通过使用沪深300和中证500的月度收益率代表大小盘股指,利用已有研究得到对于大小盘风格轮动较为重要的解释变量(主要包括宏观经济数据与大小盘收益率之差相关的指标),进而利用这些解释变量进行内生化的风格轮动建模。通过CatBoost、LightGBM、XGBoost、随机森林等机器学习模型,利用规定时间段内的因子数据,建立模型对月度超额收益率进行滚动训练预测,并将机器学习模型回测结果与等权重线性的多因子模型回测结果进行对比。

针对问题三,通过仓位控制控制最大回撤。由于要求最大回撤<10%前提下进行收益最大化的建模,因此需要对整体仓位进行限制。通过控制最大回撤小于10%确定总资产中分配于股票市场的资金,并将总资产中其他资金投资于国债等无风险标的。

综上所述,本文量化投资方案的亮点在于:一是创新了风格轮动解决思路,使用内生化的风格轮动策略量化宏观经济变化对于大小盘风格的影响,同等风险下提高了选股的收益;二是使用了较为新颖的机器学习算法以及集成学习思路,模型具有较高的样本外预测准确率;三是将选股模型与资产组合理论相结合,获得更稳健的超额收益。

关键词:多因子选股;风格轮动;集成学习;CatBoost;LightGBM

查看全文