论文部分内容阅读
金融管理研究的一个显着特点是数据分析量非常大、不确定性因素多,面对当今时代的海量金融数据,基于传统的统计技术建立的模型假设条件多,在实际应用中难以凑效。数据挖掘是20世纪90年代中期兴起的统计决策新技术,其过程是发现海量数据中有用的模式,目的在于使用所发现的模式帮助解释当前的行为或预测未来的结果,以人们容易理解的形式提供有用的决策信息。随着IPO的重启,我国的股票市场不断的扩张,股票交易数据规模越来越大,寻找股票价格有价值的模式信息也越来越困难。股票时间序列本质上具有非线性、非平稳、信噪比低的特点,数据挖掘是为了发现序列中隐含的一些本质规律,高噪声的存在一方面淡化规律的显着性,另一方面也可能会提供一些假信息,从而严重影响数据挖掘的效果。针对上述两个关键问题,本文重点研究了基于小波消噪的聚类模式挖掘在股票收益率预测中的应用。本文主要拟完成的研究工作包括以下几个方面:(1)探讨了数据挖掘技术应用在金融领域的重要性和必要性;并就从海量金融数据中挖掘其隐含模式进行可能性分析;(2)考虑到金融时间序列数据的高噪声性,本文拟利用小波去噪方法对数据进行预处理,并提出改进的小波阂值去噪方法,选取合适的小波基函数、阈值准则、阈值处理函数和分解层数对数据进行去噪处理;(3)结合聚类分析方法和时态序列模式挖掘技术构建聚类时态序列模式挖掘技术模型,改进传统的时态序列模式挖掘技术中的不足之处,优化其算法,并利用随机数据进行模拟实验,验证其模式挖掘的效果;(4)利用构建的聚类时态模式挖掘技术模型进行实证研究,选取沪深两市各20只股票,选取2005年1月31日到2007年12月31日的股票收盘价为数据样本,将其中前一半数据作为模式挖掘对象,后一半数据作为模式验证对象,判断模式挖掘的有效性,并利用挖掘出的隐含模式对未来作出决策和预测。