概率流上复杂事件处理的研究

来源 :东北大学 | 被引量 : 0次 | 上传用户:hawk216813
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着无线射频识别(Radio Frequent Identification, RFID)和传感器等电子数据采集设备(Electronic Data Gathering Equipment, EDGE)的广泛应用,产生了空前海量的事件类型数据,对这些事件数据进行复杂事件处理成为了非常重要的研究方向。复杂事件处理广泛地应用于商业检测与预测、供应链管理、气候环境监测与预报和医疗监护等很多领域。然而,当前的复杂事件处理方法大都是面向确定事件数据的,对于不确定事件数据形成的概率流却无能为力,并且这些方法都缺乏对复杂事件发生前的预知能力。针对这些问题,本文提出了一套概率流上复杂事件处理方案,它包括通过启发式搜索和过滤实现的概率流上复杂事件检测算法HSF-CED (Heuristic Search and Filter-Complex Event Detection)以及基于语义向量聚类和SVR建模的概率流上的事件预测算法SVC-SVREP (Semantic Vector Clustering-Support Vector Regression for Event Prediction)。本文的贡献点主要体现在:首先,针对不确定事件数据形成的概率流,建立一种概率流模型,该模型不仅能表达EDGE设备检测出的不确定事件,而且可以通过贝叶斯网络表达和推理出不确定事件的概率分布。在此过程中,提出了CP-Tree (Conditional Probabilistic Tree)结构来存储贝叶斯网络中的条件概率,CP-Tree相比于传统的条件概率表不但节省了存储的空间,而且减少了查询的时间。其次,提出了一种新的概率流上复杂事件检测算法HSF-CED,该算法基于一种链式队列结构启发式地搜索出满足查询请求的复杂事件,为了提高检测效率,放大概率阈值对复杂事件进行无损过滤,并通过适当地设定允许偏差实现复杂事件的有损过滤,在提高效率的同时,保证查询结果的查全率。再次,设计了一种语义向量结构,它表示大小为一个基本窗口的概率流片段的语义,通过语义向量不但可以表达流片段的语义,而且把结构不同的流片段转化为相同结构的语义向量,有利于建立预测模型。最后,提出了一种全新的概率流上基于语义向量聚类的事件预测算法SVC-SVREP,该算法通过对语义向量的聚类和SVR建模,可以预测出目标复杂事件在未来的一段时间之内发生的概率。此外,本文的复杂事件处理方案可以根据不同的需求设置不同的参数,从而返回不同的结果。通过实验表明,此套复杂事件处理方案在概率流上能高效地检测出复杂事件,并且能在保证较高的准确性的前提下,预测出目标复杂事件发生的概率。
其他文献
普适计算可以随时随地的提供计算服务,当具有计算、感知能力的设备节点无处不在时,节点如何自动获得其它节点所提供服务并实现各节点间的相互协作是亟待解决的关键问题。信息
随着互联网的不断发展,智能手机、平板电脑等智能终端在人类生活中的普及以及移动网络带宽的不断提高,使得微信、微博等社交媒体已经渐渐成为了人类生活中不可或缺的部分。人们
随着结构化数据在互联网应用中的大量出现,对复杂数据进行图建模在近年来越来越流行。图索引问题在图数据库应用中至关重要。本文主要研究了图数据库上的图索引问题。本文提
癫痫是影响人类健康的一种神经系统疾病,给患者和社会带来严重的影响。脑电是常用的一种癫痫诊断技术,但受到技术限制,癫痫脑电目前还主要依靠医生经验人工判断,尚未实现自动诊断
随着计算机技术的高速发展,计算机系统被广泛的应用于航空航天、军事国防、医疗卫生等高可靠性领域,人们对计算机系统在软件和硬件方面的可靠性要求也大大提高。因此,计算机
寻求新型有效的压缩方法始终是数字媒体领域的关键问题之一。基于内容的压缩代表着新一代的压缩方法,也是本课题所提出的冗余内容压缩方法的来源。传统的数据压缩算法中,通常没
网络环境下,多样化的传播途径和复杂的应用环境使网络蠕虫发生频率增高、潜伏性变强、覆盖面更广。不断给网络造成的巨大危害表明,传统的防病毒技术已不能满足网络蠕虫防治的
与文本无关的说话人识别的研究,由于其实用性,成为当今语音识别领域中的热门课题,经过几十年的发展,已经取得了巨大进展。尽管在实验室环境下,说话人识别系统已经取得了比较
学位
在生物信息学研究中,蛋白质二级结构预测是重要的研究内容之一。从氨基酸序列来预测蛋白质二级结构,这本身就是我们理解蛋白质结构和功能的重要一步。在分子生物学中,若能成