论文部分内容阅读
普适计算环境的特点是以人为本,旨在为用户提供高效精确的、无处不在的个性化服务。为了达到这一目标,就需要对海量的、离散的原子事件进行自动智能分析,提取用户感兴趣的、可以直接服务于终端用户的复合事件。人们称这个过程为普适计算中的复合事件检测。随着复合事件检测应用的日益广泛,在复合事件检测的研究与分析中涌现出了许多有趣的、亟待解决的问题。本文围绕复合事件检测中的若干热点研究问题展开了深入分析与探讨,主要贡献阐述如下: (1)复合事件检测框架结构 为了在普适计算应用中高效地检测复合事件,本文提出了复合事件检测的框架结构。该框架包括两个子过程:复合事件检测和复合事件执行,它们是两个相反的过程。复合事件检测是对反映物理世界的原子事件进行过滤、关联、聚类等操作,从而产生能够直接反映用户需求的、有意义的复合事件。复合事件检测子过程包括原子事件缓冲区、预处理单元、数据管理、检测调整等部分。复合事件执行的目标是把复合事件分解为一系列相应的原子事件,通过语义分析,这些原子事件能够被物理设备识别并执行。复合事件执行子过程包括用户界面、事件分解器、资源管理、事件调度和执行等部分。 (2)事件的乱序性 在普适计算环境下,由于机器故障或者网络延迟经常导致处理引擎中的事件流发生乱序。因此,现有的方法就会抛错,出现漏解或者产生错误的事件模式。另外,现有的研究工作大多只考虑了时间点事件,而现实世界中的许多事件都是基于时间段的,都具有一定的持续时间。基于时间段的事件之间的时态关系通常更为复杂,本文提出了基于时间段的乱序事件模型,包括逻辑和物理两种表示方式。对于时间段事件的模式查询,其状态转换不仅依赖于事件类型,而且取决于事件之间的关系和谓词。因此本文提出了一种更优的基于树的索引结构来完成基于时间段的乱序事件查询处理;提出了实时性和准确性两种方法来解决基于时间段的乱序事件;并通过实验证明了方法的可行性和有效性。 (3)事件的关联性 现有的复合事件检测研究工作通常都存在一个强假设,就是事件流之间是相互独立的,不同事件之间不会相互关联,也不会相互影响。但是在现实应用中,事件之间存在着千丝万缕的联系。如果不考虑这些事件之间的关联性,就会得出错误的结论。因此在进行复合事件检测时,必须全面地考虑同一个体不同时刻之间的关系,以及不同个体之间的相互作用和相互影响。本文利用Flickr上的照片数据作为分析研究的事件数据源,第一次提出了Flickr中照片-标签-景点的数据表示模型,给出了数据的完整定义和描述,并引入邻接矩阵来表示其关联关系;提出了一种基于主题模型的新方法来检测景点旅游特色,并将其表示成一系列标签的概率组合;考虑了同一景点在不同时节的旅游特色的差异,并能够在没有用户标注的情况下自动完成检测。 (4)事件的等级性 目前的很多研究工作都是将事件从原子类型转化成复合类型,很少有研究工作是将复合类型的事件进一步转化成更为复杂的复合事件类型。本文整合景点特色,用户兴趣爱好等复合事件,研究基于复合事件的时空景点序列分析。在已知景点特色和用户兴趣爱好的前提下,选择一系列符合用户兴趣的带有权值的景点,在特定的旅游时间内,为用户提供一个权值最大,并且走的路程最短的时空序列,从而用户可以在最短的时间内,游览尽可能多的最想游览的景点。本文证明了此问题是一个NP难题,并提出了时空序列分析的两种近似算法:局部优化算法和全局优化算法。 进行复合事件检测技术研究的最终目的是为用户提供高质量的服务。基于本文在复合事件检测方面的研究成果,以照片共享平台Flickr为应用背景,设计实现了时空景点序列分析原型系统——OrientSTS。该系统以本文提出的模型和设计思想为基础,对核心算法进行了实现,旨在验证本文所提出的复合事件检测模型、思想和算法的有效性。