论文部分内容阅读
数据挖掘技术源于商业的直接需求,因此它在各种商业领域都存在广泛的使用价值。通过在海量的股市历史数据中进行数据挖掘,得到较高兴趣度的数据,然后进行分析,并使用其它数学工具进行预测,或是研究其趋势走向,已经成为证券界所关注的焦点。利用数据挖掘、小波理论对证券时间序列的时变自相似指数、波动的模拟和股价指数预测等方面进行深入研究,从而有效地挖掘原始数据中蕴藏的有用信息,解决信息爆炸时代知识获取的瓶颈问题,为投资者、企业和监管机构提供准确、及时和全面的决策信息。主要研究内容如下:利用数据挖掘进行聚类分析,利用基于遗传算法的聚类技术进行数据的提取。概念聚类技术其要点是,在划分对象时不仅考虑对象之间的距离,还要求划分出的类具有某种内涵描述,从而避免了传统技术的某些片面性,该算法是在遗传算法思想与K-Means算法思想的基础上结合产生的,首先,产生遗传算法的第一代并开始进化,在每代进化中,我们都用K-Means方法对每个个体进行进一步的优化,这相当于在每一代都要对所有个体计算以其为初始值的K-Means问题的局部最优结果,并以这些局部最优结果替换掉原来的个体并继续进化,直到达到最大代数或者结果符合要求为止。这种方法力图通过遗传算法来保证获取全局最优解,而用K-Means方法提高算法的收敛速度。针对傅立叶变换不能确定信号奇异点的分布情况及其位置的缺陷,研究了证券时间序列周期检测的小波理论及应用,提出利用小波变换检测证券时间序列的可行性,并在简述证券时间序列预测技术研究现状的基础上,进行了小波预测与实证的比较研究。本文的创新点主要是首次把数据挖掘和小波理论应用到股市分析和预测中,把普通的K-means算法和遗传算法结合起来,使之成为有效的数据挖掘聚类分析工具;同时把证券领域的ARIMA算法结合到预测模型中使之成为一个灵活、有效的决策支持系统。