时间序列近似表示与聚类算法研究

来源 :重庆邮电大学 | 被引量 : 0次 | 上传用户:ly_exe
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
时间序列是在时间轴上描述的事物某种特征的变化趋势。时间序列无处不在,存在于许多领域,但时间序列本身复杂、高维、数据存在噪声等,因此研究如何对其进行数据挖掘具有重要意义。本文以时间序列为研究对象,针对其数据量较大,不利于后续处理的问题,在此研究时间序列近似表示方法。时间序列近似表示中的分段表示由于其简单直观、支持时间序列的相似性搜索而应用较广,在此对时间序列分段表示进行进一步研究。同时,由于分段表示的时间序列在聚类时与其他类型的数据形式差别较大,因此,在分段表示的基础上,研究如何对分段时间序列数据进行有效聚类。本文首先对时间序列背景意义及研究现状做了总体介绍。其次,对时间序列近似表示及聚类分析的理论基础做了总结概括,并提炼出本文需要进一步研究的问题,提出一种基于关键点的高阶多项式时间序列近似表示方法(A High-order Polynomial Approximate Representation Method Based on Key Points for Time Series,KPPR)。算法主要思路分为两大部分:(1)寻找序列关键点:局部最值点及满足条件的极值点;(2)高阶多项式表示的理论依据和数学推导。最后仿真验证表明:该近似表示方法能在不同压缩率的情况下保证良好的趋势提取效果,通过算法对比,KPPR在保证压缩率的同时有效减小拟合误差,提高时间序列近似表示拟合精度。其次,聚类在识别数据对象的内在关系上意义较大,然而聚类算法大多是对离散数据集的类簇形状进行聚类,对以分段时间序列为聚类对象研究较少。因此,本文研究对KPPR算法得到的结果集进行层次聚类,提出一种基于DTW距离度量的层次聚类算法(An Modified Hierarchical Clustering Algorithm Based on DTW Distance measurement,DTWMHC)。算法总体思路分为两大部分:(1)距离度量方式的改进:用更适用于度量时间序列相似性的DTW代替欧氏距离进行距离度量;(2)算法效率的改进:层次聚类算法复杂度较高,不利于处理大规模序列,本文对层次聚类距离矩阵更新方式进行改进,减小运算量。最后进行仿真验证,证明该算法聚类有效性较高,同时,降低了算法运行时间。
其他文献
1、低温处理。利用低温,抑制腐败微生物的繁殖和组织的自溶作用。一般分冷却与冷冻两种方法。冷却就是使水产品降温至0℃左右,多用于短期或临时贮藏;冷冻则使水产品在-18℃以下
传统教学模式下,历史与社会教学往往是教师一个人'独领朝纲',学生只是充当'听众''观众'的角色,导致课堂死气沉沉,学习积极性较差,且这种教学模式难
本文分析了《极地规则》和《SOLAS公约》对于北极航行船舶的特殊要求,归纳了《STCW公约》对于航行于该水域船员通信方面培训的要求,结合几年来从事相关培训的经验,提出了北极
党的十五大五中全会提出,要按照生产发展、生活宽裕、乡风文明、村容整洁、管理民主的要求,稳步推行社会主义新农村建设。乡风文明.是社会主义新农村建设的思想保证和精神动力。
预设与生成是教学中的一对矛盾体,又是一对相互促进体。精彩的生成正是源自于高质量的精心预设,教学过程是一个师生及多种因素之间动态的相互作用的推进过程,不可能百分之百
在新课程初中数学教学过程中,构建积极有效的课堂教学氛围,最大限度的提高教学效果,是每一个数学老师经常谈及的话题。教学既是一门科学,又是一门艺术。在新课程背景下,广大数学教
青年担负着实现中华民族伟大复兴的时代重任,他们能否顺利成长成才关系着中国特色社会主义事业是否后继有人。青年成长成才是实现人的自由全面发展的必要条件,但这一成长成才
信息技术与小学语文学科的整合,就是把各种信息技术手段完美地融合到小学语文学科教学中,共同完成课程教学任务的一种新型的教学方式。其根本宗旨是培养学习者能够在信息化的环
兴趣是最好的老师,教师除了注重收集素材,遣词造句,布局谋篇方面的指导,更要重视激发学生习作的兴趣。教师应变多问多讲,以教师分析为主的作文教学为学生动手、动眼、动脑、动口,边
科学技术的突飞猛进,社会经济的快速发展,需要更多的高素质的创新人才,而高素质的创新人才必须依靠创新教育,而创新教育又必须依靠教师。教师进行创新教育是时代发展的需要,是历史