时间序列线性表示方法及其相似性度量算法研究

来源 :山东科技大学 | 被引量 : 0次 | 上传用户:ylmny
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
时间序列数据是一类重要的复杂数据对象,广泛存在于自然现象和社会经济等领域中。应用数据挖掘技术分析时间序列数据能够发现时间序列中所蕴涵的知识,因此时间序列的数据挖掘是数据挖掘的重要研究热点之一。其中,时间序列线性表示方法及其相似性度量算法是时间序列数据挖掘的研究重点。在对时间序列进行各种操作之前,必须对时间序列数据首先进行预处理,得到高质量的数据以便处理。时间序列线性表示是数据预处理的基本方法。本文在研究了现有线性表示方法的原理后,分析总结了它们的缺陷,提出了一种新的线性表示方法——趋势变化点线性表示法。趋势是指时间序列的运行方式,趋势变化点是指在该点之前和该点之后时间序列的运行趋势不同,本文提出的趋势变化点线性表示方法不仅可以很好的消除噪声干扰,而且能够有效的发现单调序列关键趋势变化点。本文研究了已有的时间序列相似性度量的各种算法,分析总结了基于点距离匹配算法在时间轴伸缩方面的缺陷。针对该类算法的主要问题,本文借鉴“模式距离”度量算法的思想,提出了“趋势模式”的概念,并在相似性度量条件中加入了时间跨度比重约束,提出了基于趋势变化点的趋势模式距离度量算法来计算时间序列的相似性,该算法不仅很好的解决了时间轴问题上的缺陷,而且还能够预测时间序列未来的运行趋势,有效解决了已有相似性度量算法的问题。农业产量预报工作是更好地制定农业政策、发展农业生产和农产品贸易的重要基础工作。本文将上述研究成果应用到农产品产量时间序列中,实验一的结果验证了趋势变化点线性表示方法能够更加有效的发现序列中的趋势变化,为后续的时间序列操作提供了高质量的序列表示;实验二的结果验证了趋势模式距离度量算法在应用中具有较高的度量准确性,以及将预测融于度量算法是可行的。
其他文献
近年来,现代服务业发展迅速。现代服务业大多需要IT服务系统的支持,这催生了对服务工程的系统研究。哈尔滨工业大学在模型驱动体系结构(MDA)的基础上提出了面向服务的模型驱
随着新型非易失性存储器(Non-Volatile Memory,NVM)技术的飞快发展,这类存储器件在访问性能、写寿命等方面越来越接近内存。存储级内存技术(Storage Class Memory,SCM)是针对
物体识别是当今计算机视觉领域的一个难点问题,引起越来越多的计算机视觉工作者的兴趣与关注,其主要过程是使用相关算法在图像中把感兴趣的物体识别出来。同时,它也是机器人
安防系统在社会生活和工业生产中占有举足轻重的地位,而视频监控系统是目前安防体系中非常重要的一个环节,因此,研究和实现智能化程度高、通用性强的视频监控系统不仅具有一
随着众多信息系统的开发和投入使用,由于开发平台的多样化,应用系统的复杂性,数据的共享已经成为主要议题,这就提出了一个异构数据在不同系统之间转换的问题。本文在分析了模
随着工业设计自动化和计算机网络的发展,网络环境下的协作型计算机辅助设计(CAD)已经越来越多地成为产业界的选择,越来越多的CAD模型通过互联网进行发布。在线CAD发布给工业
随着数字化多媒体技术的迅速发展,人们对各种数字图像的需求日益增长。由于图像具有信息量巨大的特点,因此在传输、存储前需要对其进行数据压缩。在目前主流的视频和图像编码
随着在线社交网站的巨大成功和无线技术的不断成熟,一类融合社会性和移动性的新型网络形式——移动社交网络(Mobile Social Networks, MSN)便开始逐步诞生。在MSN中存在几个
随着网络技术的持续发展,基于网络的开放式应用不断涌现,这类应用的用户群体呈开放和动态的特点,且通常与应用系统不属于一个信任域,这对应用实施访问控制和授权提出了挑战。解决
在这个客户资源弥足珍贵的时代,什么才是企业的核心竞争力呢?对于所有的企业而言,至少有一项不可或缺的,那就是客户关系管理的能力:把一次性客户转化为长期客户,把长期客户转化为终