论文部分内容阅读
近年来量化投资领域逐渐受到广泛关注,成为一个十分热门的研究方向。利用数学、统计、机器学习等技术,量化投资充分挖掘各资产历史价格演变的规律,利用这些规律形成投资策略,获取高额收益。量化投资近年来受到了机构投资者以及个人投资者的广泛关注。量化投资兴起于二十世纪六十年代,当时随着计量工具的研究,不断有投资者尝试对市场价格进行定量化研究。而我国金融以及相关衍生品市场起步较晚,量化投资受到市场的广泛重视是2010年以后的事情。而且目前市场上量化相关的投资理财产品相对较少,同时由于市场交易规则限制,量化投资策略也不如欧美等国家丰富,因此量化投资策略的研究在我国市场具有巨大的发展空间。A股市场是我国目前较为成熟以及体量较大的市场,因此如何构建适合于我国股市的量化投策略具有重要的现实及理论意义。自2010年以来,新股具有较为明显的溢价发行的特征,上市后价格往往出现暴涨,因此出现了诸多打新股的策略。但是受到发行量的限制,新股往往一签难求。同时由于新股上市后出现的大波动现象,造成了新股在一段时间内的价格变动具有同其他股票不一样的特点,因此研究次新股的价格特点,寻找交易机会也具有较大的实际意义。从统计上看,经过上市初期的一轮暴涨后,新股往往会出现价格下跌回调,然后重新上涨的过程。同时也并非所有的新股都具有同样上涨的概率,经过统计发现30个交易日以后,超过50%的新股价格会出现下跌。因此如何构建一套针对次新股的量化交易策略,指导投资者在进行次新股交易时进行科学的选股便变得十分重要。近几年来机器学习发展迅速,很多研究都关注机器学习在量化投资中的应用。机器学习的很多算法,如支持向量机(Support Vector Machine,SVM)、梯度提升决策树(Gradient Boosting Decision Tree,GBDT)等算法对于非线性问题的预测都有较好的效果,而对于次新股的涨跌可以转化为机器学习中的分类问题。因此本文尝试使用SVM、GBDT等机器学习模型对次新股涨跌进行预测,并构建交易策略。本文采用定量化的研究方法,从聚宽、Tushare等开放数据库中提取了2006年1月1日到2017年12月31日的上市A股的行情数据。经过统计分析发现上市新股自上市后30个交易日内具有不同于其他股票的波动性。通过单因子测试发现总股本、总市值、换手率、市盈率、市净率、市销率等因子与新股上市后30个交易日的涨跌具有显著关系。通过建立SVM以及GBDT模型对上市新股进行预测,GBDT的预测AUC达到0.91,SVM的预测AUC达到0.77,均具有一定的预测能力,而GBDT的预测能力优于SVM模型。基于统计分析以及建模分析,构建了三组交易策略,包括短线回调交易策略、次新股多因子交易策略以及机器学习短线交易策略。短线回调交易策略的收益为423.9%,具有较好的效果。而基于次新股因子的交易策略收益率为14.7%,为对比多因子的效果,对单个因子的盈利能力进行了测试,发现如果单独使用独立因子进行选股,效果都相对较差,而使用多因子模型进行综合选股,在年化收益上有近15个百分点的提升。在基于机器学习的短息交易策略中,分别使用SVM以及GBDT进行决策。基于SVM的交易策略收益率为121.36%,但是资金收益曲线波动较大,最大回撤有35.6%。而基于GBDT的交易策略资金曲线平滑,收益率为128.7%,最大回撤为9.8%,对比基于SVM的交易策略收益上提高了7个百分点,而最大回撤降低了近26个百分点。本文通过对A股市场2010年以后的上市股票数据进行建模分析及实证回测后,结果表明GBDT及SVM模型对次新股具有一定的预测能力,回测的收益较为稳定。本文的方法为进一步构建量化策略提供了思路。