符号化高维时间序列的检索算法研究

来源 :大连理工大学 | 被引量 : 0次 | 上传用户:cxddqqqqqq
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
大规模的时间序列的数据挖掘问题在近些年的关注程度逐渐升高,其中高维时间序列的检索算法更是难点。由于数据维度的增多,大大增加了数据挖掘算法的复杂性,一些学者认为将时间序列符号化是十分必要的。在符号化方面,很多当今成型的算法大都是针对一维序列的,无法很好的应用于高维时间序列的符号化。本文提出一种基于多级κ均值聚类的高维时间序列的符号化方法。通过定义最大允许的平方误差τmax,来决定符号化的粒度。在符号序列检索方面,以倒排表数据结构为基础设计出一套针对符号化时间序列的检索算法。首先将倒排表查询的粗筛选算法转换成界限t集合求交问题,并提出一种基于堆的完全划分方法,使得算法在原有的基于堆的不完全划分的方法上有了较大提高。采用最长公共子序列(LCSS)作为度量序列间距离的方法。不同于传统的LCSS算法,本文提出了一种限制最小匹配率ρmin的Limited-LCSS算法,并在此基础上针对倒排表的数据结构特点对算法进行了优化,显著的提高了算法的效率。并实现了时间轴的弹性匹配。定义了高维字符的匹配方法,使得算法适用于高维的字符化时间序列的检索。最后针对人体动作序列这一典型的高维时间序列进行索引实验,证明算法具有较高的运算效率,在数据引入噪声的情况下,依然有这较高的正确性。
其他文献
随着计算机网络技术的飞速发展,网络规模急剧膨胀,带宽成倍增长,复杂性、异构化程度不断增加。基于计算机网络的各种应用业务也越来越广泛,尤其是新的应用(如VoD,VoIP,P2P)的
科学计算可视化视是20世纪80年代发展起来的一个新的研究领域。它主要运用计算机图形学和图像处理技术,将科学计算过程中产生的数据及计算结果转换为图形及图像在屏幕上显示
在移动计算环境中,人们对移动应用的健壮性、实时性等要求逐渐提高,并且受到移动网络的上下带宽不一致、频繁断接性等特点的影响,以固定网络为基础的分布式技术已经无法达到
基于图像的路面病害自动识别和分类,一直是图像处理和模式识别领域内的一项具有挑战性的工作,对高速公路路面的维修和养护,具有很好的指导作用。本文基于江苏省自然基金项目:
目前安全协议的安全性仍是学术界关注的重点,但是安全协议的安全性分析仅仅停留在对安全协议抽象分析和验证方面,很难应用于日常研究中,而且在安全协议的代码实现中难免会出
随着计算机技术、网络技术、多媒体技术和人工智能的发展,尤其是互联网技术的发展,计算机网络的应用领域越来越广泛,现代远程教学就是建立在其上的典型应用。流媒体课件系统
随着计算技术、通信技术、传感技术等新科技的飞速发展,普适计算正在成为现实。普适计算强调把计算机嵌入到环境或日常工具中去,让计算机本身从人们的视线中消失,让人们注意
随着P2P技术的飞速发展,基于它的分布式应用已渗透到很多领域。P2P的分布式应用需要P2P网络结构的支撑,因此P2P网络结构的研究具有非常重要的意义。目前已有的P2P网络结构主
传统Steiner树问题在VLSI设计、无线通讯网络设计和生命演化树重建等领域的新应用被逐渐发现和深入研究,但是这些应用通常需要对传统Steiner树问题作某些修改,因此研究Steine
图的等全着色是图的着色问题中的难题之一。对图的等全着色问题的研究不仅具有重要的理论意义,而且在安排课表、频率分配等领域有很广泛的应用。图的彩虹支配问题是图的支配问