基于SOM的时态近似周期的数据挖掘研究

来源 :湘潭大学 | 被引量 : 0次 | 上传用户:ericlin1985
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着人们对时态数据挖掘的深入,周期挖掘作为时态数据库中用于理解时态数据、预测未来趋势的一个非常有意义的特征,也越来越受到国内外学者的关注。因此,周期挖掘日益成为时态数据挖掘中一个十分重要的研究课题。然而,目前很少有人研究近似周期挖掘,即事件发生后,相隔一个时间周期(该时间周期可以在固定时间K的时间范围δ内波动)事件重复发生,我们称之为近似周期。这是一个很有意义的研究方向,因为在金融、气象、水文、医疗、超市等领域有很多时间数据看上去没有严格的周期规律,但有大多都存在近似周期的规律。例如股票价格变化,基本上没有周期规律,而我们能够发现股票的近似周期,这对研究股票价格变化是非常有意义的。因此,近似周期挖掘在金融、气象、水文、医疗、超市等领域有着广泛的应用前景。本文从下面几个方面对时态近似周期进行了研究:⑴介绍了时态周期挖掘的研究背景和不足,引出本文研究的内容。⑵在时态型、时态因子和时间粒度的基础上,给出了时态近似周期的严格数学定义,如近似周期模式、近似周期模式的支持度、置信度、近似精度和模式覆盖等,证明了相关性质,并研究了基于SOM聚类的时态近似周期的挖掘算法,实验表明了算法的有效性。⑶扩展了时态近似周期的定义和性质,提出了时态近似周期关联规则的概念和性质,研究了基于SOM聚类的挖掘算法并进行了实验。⑷在多粒度时间的概念和性质的基础上,给出了多粒度时间间隔的数学定义和性质,提出了多粒度近似周期的概念和性质,研究了基于SOM聚类的挖掘算法并进行了实验。本文获得的主要成果为:⒈给出了多粒度时间间隔的严格数学定义,并证明了相关性质。⒉提出了一种时态近似周期的数学模型,给出了基于SOM聚类的挖掘算法。⒊提出了一种时态近似周期关联规则的数学模型和基于SOM聚类的挖掘算法。⒋提出了一种多粒度近似周期的数学模型和基于SOM聚类的挖掘算法。实验结果表明了所提出的算法能够发现股票价格变化的近似周期,说明了所提出的算法对发现近似周期是非常有意义的。
其他文献
近年来,数据挖掘的研究得到了快速发展,数据挖掘的成果已经广泛地被运用到了许多行业。时态数据挖掘是数据挖掘研究的一个重要的组成部分。时态特征聚类作为时态数据挖掘的一个
随着Internet的发展,越来越多的高带宽需求的多媒体应用带来了带宽的急剧消耗和网络拥挤问题。多播是一种介于单播和广播通信之间的数据传输方式,它提供了一种一到多或者多到
PLC技术、网络技术及数字设备的不断发展,促使工业控制从传统的模拟控制逐步走向数字控制,从分散控制走向集中控制,从人工操作发展成为计算机控制。计算机软硬件技术已经渗透到
车载监控终端集全球定位技术,移动通信技术和地理信息系统技术于一身,它不但是智能交通系统的重要组成部分还能实现许多安全防范功能。 本文通过对GPS卫星定位理论、卫星数
分布式关联规则挖掘研究是为解决分布式环境下的关联规则挖掘问题而出现的新课题,具有重要的理论和实际意义。概念格通过概念的内涵和外延之间的关系以及泛化和例化之间的关
随着信息技术的高速发展,综合了计算机技术、网络技术和通信技术的嵌入式技术己成为人类继PC和互联网之后最热门的技术。嵌入式技术的应用已经广泛渗透到我们的工作、生活中,特
近年来,可靠性正在成为体系结构研究领域越来越重要的研究点。现在已经有很多可靠性模型可以用来在体系结构层次上预测软件的可靠性,但是绝大部分工作都没有给出软件体系结构的
随着网络的发展和人们对通讯业务需求的不断增长,传真、文本、图像和语音视频等各种各样的新业务层出不穷,尤其是VOIP(Voice Over IP)业务的发展非常迅速。这些业务突出的特点
拼音输入法不仅具有易学易会的特点,而且拥有相当多的用户。目前市场上的拼音输入法一般是以词为单位进行输入的,具有拼音串可编辑和汉字串可编辑、混合输入、模糊输入、机器
随着互联网技术的迅速发展,许多工作被移植到互联网上,极大提高了工作效率,促进了生产和科研的进步。网上协同工作的目的就是利用互联网的优势条件,促进组织为了共同的目的进行高