论文部分内容阅读
我国的证券市场在较短的时间内就已经达到了发达国家发展了几乎上百年的规模,在这样快速的发展过程中,也存在很多问题需要解决,其中证券市场中海量数据的分析与处理问题就是当前我国证券行业所面临的一道难关。本文首先介绍了股票信息系统的研究背景与研究意义,通过对国内外常用的股票预测方法进行介绍,实时了解当前股票预测过程中存在的不足和已有研究者提出方法的一系列优点;其次,对本文使用的数据挖掘的三种方法进行了详细介绍,其中主要介绍了决策树分类算法、关联规则算法以及神经网络算法,并阐述了使用Map Reduce来并行实现算法的框架与思路;接下来,对股票信息系统进行需求分析与系统设计,其中包括了对用户管理、交易管理、股票分析管理、查询功能管理以及短信预警管理等5个模块进行用例分析,并且对这些模块进行详细设计以及确定了系统的整个架构;再则,对数据挖掘的三种方法在股票的应用进行了详细阐述,其中包括了决策树分类算法在股票中的应用、关联规则在股票中的应用以及神经网络模型在股票中的应用等三个部分,同时采用Map Reduce来提高算法的运行效率,实验表明这些方法具有一定的合理性和实用性;最后,本文对股票信息系统的各个界面进行了实现与测试。通过完成整个股票信息系统,本文主要的贡献如下:(1)开发出一个满足不同职业的用户的股票信息系统,加入数据挖掘算法使得股票信息系统更具有实用性;(2)决策树对股票进行分类,并对分类后的结果进行分析以及模型进行评估;然后运用关联规则进行分析,发现股票板块之间、区域之间存在较强相关性的原理。通过选取股票一定周期的数据,采用决策树分类方法构建特定的股票领域分类模型,并根据实验对分类结果进行分析,发现该方法在股票预测中具有较高的准确性。(3)运用关联规则中经典的Apriori算法运用到证券分析中,从而挖掘出具有指导意义的股票预测规则。(4)通过应用人工神经网络模型来对股票的股指进行运用,主要是根据大盘的最高点预测曲线与真实最高点指数曲线进行比较得出:BP网络对股市盘点具有预测效果好、数据拟合精度高的优点,它是一个适合对证券市场数据进行拟合的方法。同时采用Map Reduce框架实现了BP神经网络算法的并行运行,有效的提高了算法的运行效率。