论文部分内容阅读
随着中国大国崛起,经济发展日新月异,人们手中掌握的财富越来越多,市场上各种保本理财产品层出不穷,房地产的住房属性已经变为投资属性,都侧面说明了我国已经进入了全民投资理财时代。而银行存储利率相对较低,普通人难以抵抗通货膨胀带来的货币贬值。在前几年,中产阶级大多选择投资房地产来进行资产增值,但中央政府为了防止房价暴涨暴跌发生金融系统性风险,近些年出台一系列政策坚决遏制房地产泡沫炒作,所以许多观望者认为现在甚至到未来的5年,房地产市场没有很好的投资效益。与此同时,股票A股市场自1990年建立以来,已经发展快到30年,在国内是企业融资和广大股民的投资渠道,因此近年来,因为房地产的挤出效应,更多的资金开始流向二级市场。而中国证监会监管日益趋严,严禁各种题材炒作,开始逐步引导市场资金进行价值投资。随着沪港通和深港通的开通,以及明晟公司在2017年6月宣布将A股纳入MSCI新兴市场指数,都表明A股市场将在不久的将来和国际成熟市场接轨,逐渐去散户化,未来市场只能相对布局有着良好基本面的蓝筹股。上证50指数,这个指数更能代表A股市场未来的投资方向。本文将上证50股指的未来走势分别划分为两种(涨、跌),通过股指上个交易日数据指标来对下一个交易指数涨跌进行预测。文章第一章节介绍了选题背景和意义,以及国内外的股市研究现状,第二章节描述了统计学习理论,第三章节介绍了股市常用指标,第四章节就是模型的实证研究,运用归一法预处理上证50指数360多个交易日的19个技术指标,统一量纲,找出相关性,然后通过主成分分析降维得到5个主成分变量,接着把这5个主成分变量作为输入向量,运用非线性的支持向量机建模训练290个交易日的数据,选择高斯核函数,通过网格参数寻优和交叉验证方法得到使得分类效果最佳的核参数,得到一个函数模型,最后用测试集的72个交易日的5个主成分指标输入模型,得出下一交易日的涨跌。结合具体的指标数据,验证了 SVM模型对上证50指数的分类准确性,得到了 SVM模型收益跑赢同期上证50指数的结果。但是,由于技术有限和经验的缺失,本文未能得到更好的分类准确率,希望未来可以结合集成组合方法,得到更高的分类准确率,更好的分类预测模型。另一方面,本文选择的样本数据频率是以日作为预测周期,时间较短,波动较大,噪声也很大,而每日可能出现的不确定性因素则无法被纳入预测体系中,最终造成预测误差。所以后续可以进行周,月的样本测试。