论文部分内容阅读
时间序列数据挖掘是从大量的时间序列数据集中提取潜在、有用的知识、据此预测时间序列的未来。时间序列数据挖掘的研究也越来越受到人们的关注,现已成为数据挖掘领域的一个新的研究热点。当前时间序列数据挖掘的研究主要集中在,趋势分析、相似性搜索、序列模式和规则发现上。本文结合导师的研究课题,首先针对时序数据预测的常用典型的预测模型做了深入探讨和研究,然后结合粗糙集(Rough Sets)这一强有力的知识获取工具,提出了基于粗糙集的时序数据挖掘模型及其挖掘方法,进行了时序挖掘方法用于股票预测的研究。本文的主要研究成果及核心部分归纳如下:1.在二次指数平滑预测模型中,鉴于其平滑参数的确定难题,本文给出一种基于OWA聚合算子的确定方法,该方法有别于人工指定和机器自动产生,它是一种同时考虑了历史误差和预测误差的生成方法,它继承了上述方法的优点后,在此基础上,用OWA算子进行聚合得到一个适合特定预测系统的优化的平滑参数值,从而达到更好的预测效果。2.作者结合趋势结构序列(Trending Structure Sequence)定义了时间序列的趋势变化率结构序列(Trending Variation Ratio Structure Sequence),最近时间子序列,作者认为最近时间子序列是时间序列的信息聚集器,在此基础上,对不同的趋势变化率给出了相应的模糊语言值描述,即上升很快,上升平缓,上升很慢,持平,下降很快,下降平缓,下降很慢。3.提出了基于粗糙集和趋势变化率结构序列的时序挖掘方法。该方法先将时间序列转换成相应的趋势变化率序列并对其做模糊离散化处理,利用滑动窗口方法将趋势变化率结构序列转换成标准化的时序数据样本集,然后构造了适合于粗糙集处理的决策表。其中,决策表最后一个对象由趋势变化率结构序列的最近时间子序列后加预测目标组成,预测目标放在决策属性位置上,且条件属性集的基数等于趋势变化率结构序列的最近时间子序列的长度。然后借鉴模糊推理和模式匹配的方法,对预测目标进行了预测推理。