【摘 要】
:
随着信息技术的快速发展,数据的种类越来越多且数据规模越来越大,而时间序列是其中一种很重要的数据形式。从时间序列数据中寻找出异常极具意义,例如检测异常心电数据、异常
论文部分内容阅读
随着信息技术的快速发展,数据的种类越来越多且数据规模越来越大,而时间序列是其中一种很重要的数据形式。从时间序列数据中寻找出异常极具意义,例如检测异常心电数据、异常传感器数据等。时间序列异常有时不仅仅是数据点异常,而是连续一段数据即子序列异常,本文研究的就是单时间序列中异常子序列的检测。单时间序列异常子序列检测方法主要有基于模型的方法及基于比较的方法。基于比较的方法相比基于模型的方法来说,其思想简单直观,设置参数少,无需训练模型,算法适用范围更广。当前基于比较的方法一般通过寻找与其余子序列最不相似的子序列来进行异常子序列的检测。其中典型高效的算法就是HOT SAX(Hot Symbolic Aggregate Approximation)算法。基于比较的方法具有许多优点,但一些问题仍需解决改善,本文就是在基于比较的算法的基础上进行的异常子序列检测研究。本文在基于比较的方法框架下,提出利用子序列最小边界矩形比特化表示的聚类结果来启发异常子序列的搜索顺序,从而提高异常子序列检测的效率。考虑到原异常子序列定义不能发现相似异常的缺点,改进异常子序列的定义,采用基于k近邻的异常子序列定义,并在此定义下提出高效的异常子序列检测算法来寻找异常子序列。实际应用中有时需要检测前若干个异常,本文同时提出了检测前若干个最异常子序列的算法。时间序列数据通常是源源不断更新的,将时间序列异常子序列检测算法运用到动态时间序列数据流中进行异常子序列在线检测更具实际应用价值,本文通过深入分析时间序列数据流特点,将新定义下的异常子序列检测算法框架运用到时间序列数据流中,提出了高效的异常子序列在线检测算法以适应时间序列数据流。通过将本文提出的算法运用到模拟数据集和实际数据集中进行验证,实验结果表明,算法是有效的,且获得了较高的效率。
其他文献
随着面向服务架构(Service-Oriented Architecture,SOA)的发展和应用,Web上出现了越来越多的跨平台的、跨语言的、可扩展的、可靠和安全的服务。当用户提出服务请求后,如何根
对目前问答系统的性能分析表明,用于答案抽取来源的文档的相关性是制约问答系统性能的主要因素。相关文档检索作为问答系统的一个重要组成部分,其检索结果与问题的相关性将直
在企业级分布式应用领域中,传统的分布式应用体系结构绝大部分都是从自身的需求出发,运用各种不同的技术构成相互独立的紧耦合的封闭式系统。这些系统之间缺乏兼容性、互操作
随着信息技术和计算机技术的发展,工作流(Workflow)技术的应用越来越普遍,日常办公的绝大部分流程几乎都要涉及到工作流处理。而传统的办公自动化系统由于没有将业务流程与业
支持向量机算法是一种新的统计学习算法,在数据挖掘领域被广泛用来进行分类和预测,其快速、高效和较好的伸缩性使其适合运用在海量情报数据挖掘中。
本文通过对传统支持向
支持向量机和神经网络都是目前关于机器学习技术的研究热点。不同的是,前者是基于结构风险最小化原理,后者基于经验风险最小化原理。两者都非常适合故障诊断,但后者实现故障诊断
台湾学者W.L.Gau和D.J.Buehrer于1993年提出的Vague集理论是对Fuzzy集理论的推广。与Fuzzy集相比较,Vague集能更好、更准确地表达内容更为丰富的模糊性信息,成为智能信息处理
随着社会经济的发展,体育运动和体育产业在全世界范围内蓬勃发展起来,世界各国对大型体育赛事的关注度越来越大。为了保证体育比赛的公平公正及体育赛事报道的准确性和转播的
鉴于模糊系统具有知识易于显示表达和易于解释以及神经网络具有优良的学习能力的特点,本文通过对常用的Mamdani模型和T-S模型的模糊神经网络的研究,设计了一种基于Average的
计算机及Internet技术的不断发展使得以计算机及其网络为核心的信息系统成为现代社会不可或缺的内容。但是信息系统在安全方面还存在很多挑战。访问控制是信息安全领域一项重