基于空间索引的不确定时间序列相似性查找方法研究

来源 :南京航空航天大学 | 被引量 : 0次 | 上传用户:luwei0415
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
时间序列是由时序数据构成的特殊数列,被广泛用于预测分析、模式匹配、信息查找等应用中,是学术研究以及工业生产重要的研究对象。由于对数据的操作不可避免地会引入噪声,企业越来越关注噪声所带来的不确定性对结果的影响。本文基于连续型时间序列模型对索引构建进行研究,改进传统索引结构,构建适用于不确定性时间序列的索引结构。
  首先,本文针对传统时间序列的预处理方法,比较了MA、ARMA、UMA等预处理技术对数据的影响,并概括了不确定型时间序列的基于概率分布的连续性模型和基于集合的离散型模型的表示方法。同时,基于传统空间索引的研究,讨论了预处理技术DFT对时序类型数据的作用。接着,讨论了可用于计算不确定性时间序列的相似性度量,以及不同度量的计算复杂度。之后讨论了传统空间索引结构的特性,总结不同索引关于序列型数据的使用特点,针对离线环境及实时环境下的序列型数据构建了更加具有针对性的索引结构。
  然后,本文改进了传统R-tree索引结构,基于不确定性时间序列的连续型模型,进一步推导了基于误差函数的筛选公式,使用基于均值的欧氏距离量化了相似性差异,并为由均值和方差构成的连续型序列模型构建了VR-tree。为了提升查找的效率,本文利用度量的可量化性以及阈值的单调性,提出了快速筛选/过滤的DP剪枝策略。不同于传统的索引结构,本文通过预先计算出方差在每个树节点的极值,再利用方差极值计算出距离阈值的最小最大值,最后在阈值的最值上比较相似性的两种可能情况从而快速过滤非候选集以及获取候选集,保证了查找的效率以及精度。为了应对每个时戳对应不同的方差的情况,本文先将异方差序列规约到同极值方差后再构建索引结构再进行查找,同时为了避免规约过程造成过大的偏差,本文提出了基于方差权重的预处理算法。
  最后针对在线环境下的流式数据,本文考虑到实时数据需要快速响应、低延时、高吞吐量的特性,有针对性地优化更新和查找算法。本文利用了KD-tree的更新优势和R-tree的查找优势,提出KDR-tree作为动态构建的索引。KDR-tree通过调节对应节点内可容纳的最大点数K来减少对叶节点的分裂次数从而提升数据更新的效率。同时,K值由于减少了动态构建过程中树的深度并提高空间内点分布的密集程度,使得KDR-tree在查找时对于节点的搜索更加高效。
其他文献
加强高校主流意识形态建设,是铸魂育人工程。高校主流意识形态建设是事关党对高校的全面领导,事关高等教育改革发展稳定的大局,事关中国特色社会主义事业后继有人,事关维护我国意识形态安全。高校作为主流意识形态建设的前沿阵地,肩负着培养人才、服务社会、文化传承、科学研究、国际交流与合作的使命担当,是学习、研究、宣传和巩固马克思主义、社会主义意识形态的重要阵地。这对于引导高校师生坚定“四个自信”,培育和践行社
学位
大学生的理想教育是一个历久弥新的话题和研究热点,许多专家学者都在这一领域付出了大量的心血和精力。究其原因,还是因为大学生的理想教育十分重要,大学生的理想教育不仅事关大学生个人的成才成人和全面发展,更关系着中国特色社会主义事业和中华民族的前途命运。目前财经类高校大学生政治认同度较高,对党的新主张等有较为清晰的认识,但对于自身的理想现状以及接受的各层次的理想教育却是不满意的,这不仅给大学生理想教育工作
学位
新时期新挑战,我国在精神文化层面面临着很多新课题、新焦点。社会主义核心价值观作为我国精神文化层面的重要表现,加强对其传播和培育是时代和人民的要求。基层是精神文化层面容易出现分歧的重要战场,基层群众更充分受到外来思潮的影响。当今时代,全球化的趋势已经渗透到社会的方方面面,全球互联网的一体化和社会改革的迅猛发展,给我国进行核心价值观的传播制造了巨大障碍。面对思想层面的信仰危机,党的十八大深度总结了我国
生态民生是人类高度重视的永恒议题,也是习近平同志关之切、忧之深的重大民生实事。他围绕生态民生议题做了多次重要批示、发表了诸篇重要讲话。随着习近平关于生态民生重要论述逐渐壮大、丰盈,学术界对于习近平关于生态民生重要论述这一研究也日渐兴盛。基于此,本文以“习近平关于生态民生重要论述”为研究对象,以期能对这一论述的深入探索有些许裨益。  系统梳理这一重要论述的生成逻辑、主要内容、鲜明特征、价值意蕴及实践
学位
国际核不扩散机制自成立以来已经历经半个世纪,在这段时期内核不扩散机制为遏制核武器的扩散和世界核裁军做出了巨大贡献,为世界的和平和稳定做出了巨大贡献。国际核不扩散机制成立于冷战时期,冷战结束后,国际格局发生重大转变,核扩散形势也变得更加严峻,在后冷战时代,如何让国际核不扩散机制更好的发挥作用,是世界各国学者关注的重点。  本文主要研究国际核不扩散机制的约束力对核扩散行为的约束限制作用。通过定性分析和
学位
期刊
打开《论语》,第一句就是“学而时习之,不亦说乎”。由于中国特殊的主持人培养模式,一些主持人往往不善于学习,重视声台形表的外在播音技巧也大于对文化的学习。但主持工作又是一项需要始终将学习伴随的工作。对于,主持人国学文化的修养也要提升到一个相对的高度。  根据中共十八大以来的文化发展方向以及2014年十月召开的全国文艺工作者座谈会,笔者将文本中的“国学文化”定义为中华优秀传统文化。那么,为什么主持人要
目的:挖掘中医辨证治疗急性白血病(Acute leukemia,AL)有效的治则治法。方法:收集2013年5月到2017年5月于天津中医药大学第一附属医院血液科住院收治急性白血病患者,包括急性髓细胞白血病(Acute myelocytic leukemia,AML)、急性淋巴细胞白血病(Acute lymphoblastic leukemia,ALL)、骨髓增生异常综合征(Myelodysplas
由于具有效率高、体积小、重量轻和成本低等优点,非隔离光伏并网逆变器一直是国内外学者研究的重点。但除去了变压器的隔离作用后,光伏发电系统会有相应的漏电流产生,过大的漏电流会对发电设备和人自身的安全造成威胁。因此,如何抑制和消除漏电流成为了非隔离光伏并网逆变器的核心问题之一。本文以单相非隔离光伏并网逆变器为研究对象,着重对各种漏电流抑制电路拓扑进行分析,设计了一种零漏电流非隔离光伏并网逆变器,并对其工
混沌因其天然具有类随机性、初值敏感性等复杂动力学特性被广泛应用于信息安全及其保密通信领域中。整数阶低维混沌系统存在着安全隐患,而分数阶时滞系统难以被常规攻击手段攻破且拥有更大的密钥空间,在保密通信领域中有着更广阔的应用空间和实用价值,因此构造分数阶时滞混沌系统是提高保密通信系统安全性的有效途径。Hopfield神经网络在一定条件下能够直接生成具有良好扩散效应的混沌矩阵,本文以一类分数阶时滞 Hop
学位