基于机器学习分类算法的新股开板当日再封板预测及策略应用研究

来源 :浙江大学 | 被引量 : 0次 | 上传用户:s362613932
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本研究在系统性地综述了国内外量化投资发展状况与机器学习分类算法在量化投资应用研究成果的基础上,着重阐述了BP神经网络、随机森林、支持向量机三种监督性分类算法的概念与原理,结合2014年年初以来我国A股市场新股上市之后所呈现的连续一字涨停板现象,首创性地将各分类算法应用于预测新股开板后当日能否再次封住涨停板的应用场景中;在界定了具有“IPO后打开一字涨停板当天能够重新封住涨停板”特征的新股样本作为分类预测对象的同时,较为深入地结合了股市基本面分析框架,选择了上市公司的规模、估值、盈利等自身的特质变量以及市场或行业热度及风格转换等不同维度与类型的外部市场变量构建了七个样本输入特征对各分类模型进行了监督性训练及参数优化,筛选出了三种算法在本研究情境下的最优参数模型,构建了一套完整的基于这三个分类预测模型的新股开板后博求再封板的短期交易策略,并对不同参数维度下的新股交易策略进行了样本内回溯测试与样本外模拟交易测试,主要得出了以下几点结论与新股短期交易建议:1.从交易策略的标的选择上看,若不对打开一字涨停板的新股进行一定的过滤而直接对所有新股在打开涨停板后均进行短期追多投机交易,从长期来看是一个大概率会造成净值亏损的交易策略,而若能够有效地筛选出本研究所界定的“在打开涨停板当日能够再次封住涨停板”特征的新股且仅对这部分新股进行短期追多交易,则能够获得较高的收益风险比。2.对于任意新股,买入后不宜持有过长时间,在1-3个交易日内选择股价高点进行择机卖出该新股是较为合理的操作方案。3.三个模型预测表现方面,最优参数下的随机森林对样本内与样本外的预测准确度皆为三者中最高,具有良好的抗过拟合特性。在犯错误预测类型方面,最优参数下的随机森林犯“弃真”错误的概率显著低于支持向量机与BP神经网络,而最优参数下的支持向量机犯“取伪”错误的概率则显著低于随机森林与BP神经网络。4.在本研究构建的7个特征变量中,“开板前所属行业热度”、“开板前所属指数板块热度”以及“招股说明书中的业绩预告”等变量对分类预测的方差贡献度较高,其余变量则相对较低。
其他文献
采用水热法合成Bi_2Te_3粉体,将炭黑(CB)与其掺杂制备不同比例的碲化铋/炭黑(Bi_2Te_3/CB)复合材料,研究复合材料的热电性能。同时采用TGA、SEM、XRD等分析方法表征Bi_2Te_3/
小额贷款公司自2008年在全国范围内开展试点工作以来,无论是公司数量、从业人员数,还是实收资本都得到了迅速发展。近年来,受经济结构调整和金融市场发展的影响,小额贷款公司行业