聚类算法在时间序列中的研究与应用

被引量 : 12次 | 上传用户:yingchaoya
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
时间序列数据是普遍存在的,对时间序列进行聚类分析的研究可以获得大量时间序列数据中隐藏的与时间有关的有价值的信息,达到知识的获取,进而进行在知识指导下的活动。但是,实际生活中时间序列数据量非常大,因此,在时间序列聚类分析之前需要对其进行维度约减。本文的主要工作为:(1)给出了一种带权值的矩阵相似性度量方法。多元时间序列用奇异值分解方法获得特征矩阵和奇异值向量,分别作为矩阵和权值。哈达玛变换后的特征矩阵和其相关系数矩阵的特征值分别作为矩阵和权值。(2)给出了一种基于EMD和SVD的多元时间序列聚类分析方法。对原始数据进行补缺值以及规范化后,先利用EMD实现多元时间序列的趋势提取,对序列进行平滑处理,然后利用SVD进行多元时间序列长度降维,最后对原多元时间序列的特征矩阵和相应的权值进行改进的K-means算法聚类分析。(3)给出了一种基于哈达玛变换的多元时间序列聚类分析方法。对原始数据进行补缺值以及规范化后,先利用哈达玛变换实现多元时间序列的降维,同时利用小波变换也进行序列降维。然后求出不同长度的特征矩阵所对应的权值,最后对于预处理后的数据进行改进的K-means算法聚类分析。本文主要介绍了基于EMD和SVD的多元时间序列聚类方法和基于哈达玛变换的多元时间序列聚类方法。这两种方法各有其优点:第一种方法,首先,对时间序列进行EMD分解,提取时间序列的趋势。由于EMD可对时间序列中的噪音进行过滤,产生的趋势序列能够准确反映原序列的趋势走向,使得序列可以变得更加清晰,而信息丢失相对较少,所以在趋势序列的基础上进行降维,进而提高聚类效果。其次,对趋势序列进行SVD分解,可以将长度不同的序列统一到同一尺度。通常情况下时间序列大都不等长,通过SVD特征提取后序列特征的维数只与参数有关,而与序列的长度无关。这使得不等长的序列的聚类成为可能;第二种方法,首先,通过哈达玛变换进行序列降维。因为哈达玛变换后序列数据能量集中性比较高,它可以用很短的数据表示原始序列且保持原始序列的趋势变换形态。在此序列降维的基础上进行聚类分析,能很大程度上提高聚类所需时间和聚类准确度。通过实验证明,这两种聚类方法都实现了多元时间序列的有效聚类,并对两种平行的聚类算法进行了分析比较。
其他文献
随着旅游业发展的深入,旅游企业与社区居民的利益冲突及协调问题成为影响旅游业发展的重点问题。从旅游企业和社区居民的单次博弈入手建立模型,并通过重复博弈模型分析,探索
20世纪80年代末期开始的河洛文化研究,经历了从无到有、由少到多,从片面到全面、由零散到系统的渐进过程。其研究内容主要集中在河洛文化的空间与时间范围、河洛文化的内涵与
伴随着全球移动通信技术的高速演进和WCDMA、CDMA2000以及我国TD-SCDMA等3G网络的应用与推广,对蜂窝网无线定位技术的需求越来越迫切,且定位性能要求越来越高,使其理论研究越
利用激光熔覆工艺制备锡基合金熔覆层、Ni/锡基合金熔覆层。对两种熔覆层的显微组织进行分析。对两种熔覆层的显微硬度及磨损性能进行测试,并与铸造锡基巴氏合金进行对比。结
合同是实现私法自治的最主要手段,合同效力状况直接关系到交易目标的实现程度。无效是对合同效力的否定性反映,合同被宣告无效则意味着交易当事人预期目的实现的不完全。允许
戏曲是中华民族创造的独特的戏剧文化,它既古老而又年轻。与其他国家的古老戏剧逐渐退出历史舞台不同,至今仍充满了活力,是中华民族的传统理念、审美意识和思想个性的反映。
自杀死亡是一类非疾病死亡,是指由于各种原因采取一定方式结束自已生命的非正常死亡。其作为一种特殊的社会现象,已成为一个严重的社会问题和重要的公共卫生问题。据世界卫生组
新世纪以来,作家塑造了众多的农民工形象。身份认同和生存境遇始终是众多作品尤为关注的两个方面。农民工的身份在城市与乡村之间滑动,这构成了他们的身份认同焦虑。而现实生
高考复读是考生规避考试风险,追求受教育机会的一种策略。高考复读现象由来已久,一直被人们认为是很自然的现象。然而,2007年教育部长周济的讲话使得复读成为政府和许多学者
以往对外贸易的研究主要集中在出口贸易方面,对进口贸易的研究较少。而随着经济发展,一方面对资源需求日益增加,使各国经济发展面临的资源“瓶颈”问题凸显出来,如何通过进口