论文部分内容阅读
近些年国家日新月异的发展,股票市场经历着巨大变化。现在股票市场的数据规模已非常庞大、复杂,且容易受市场行情、国内政策和投资者情绪等因素的影响,随机性较强,给股票的预测研究带来了难度。数据挖掘结合了统计学、计算机学和机器学习等多门学科,可以从庞大的数据中搜索挖掘出有效信息,用于支持投资者的决策,为股票数据分析提供了有效途径,因此采用数据挖掘技术研究股票预测非常有意义。论文首先搜集了股票的27个技术指标数据并进行了指标挖掘,然后建立BP网络、RBF网络模型对个股罗牛山、海南高速和大盘深证成指进行了预测研究与分析,再针对所建立的网络模型的不足采用了遗传算法进行了优化。数据挖掘技术研究股票预测非常有应用价值,其创新性研究成果如下所述:(1)针对神经网络预测模型的输入变量是否合理的问题,提出采用Apriori算法来分析股票技术指标间的关联,确定了与股票次日收盘价相关联的指标。预测个股罗牛山和海南高速时神经网络模型的输入变量为前一日的最高价、最低价、开盘价、收盘价、成交量、成交额、换手率、MA1、MA2、MA3和BOLL,共11个指标。预测大盘深证成指时输入变量为前一日的最高价、最低价、开盘价、收盘价、成交额、MA1、MA2、MA3、BOLL、OBV和RSI3,共11个指标。并且与大部分文献所选的输入变量(前一日的最高价、最低价、开盘价、收盘价和成交量)进行了仿真试验对比研究,仿真结果验证了通过Apriori算法所选指标的可行性与有效性。(2)针对采用试凑法确定BP、RBF网络参数存在的随机性和盲目性问题,提出采用正交试验方法确定了预测罗牛山、海南高速和深证成指的BP网络参数(训练样本、隐含层神经元数目、学习速率、学习次数和期望误差)和RBF网络参数(训练样本、spread和期望误差)的较优组合,并分别与试凑法进行了仿真试验对比研究,仿真结果验证了通过正交试验方法确定BP、RBF网络参数的可行性与有效性。(3)针对正交-BP网络易陷入局部最优的问题,提出采用遗传算法优化正交-BP网络。并与正交-BP网络进行了仿真试验对比研究,仿真结果验证了GA-正交-BP网络的可行性与有效性。本文提出的上述三种方法和试验结果表明了提高个股、大盘走势的预测精度是有效的,具有应用价值,可以为投资者提供有意义的技术支持。