论文部分内容阅读
情景感知计算是为了自动根据情景信息来提供相适应的操作,使系统变得更加智能和人性化。情景的含义是任何被感知和使用的信息,其用于特征化任一实际或虚拟实体的状态。情景管理系统(Context Management System, CMS)是情景感知系统中负责数据处理和管理功能的核心成分,包含构建情景模型、管理情景数据及情景知识、提供查询接口等功能,其目的是有效管理情景信息,使得情景感知系统处理数据能力更加完善。随着物联网、语义计算等新技术的发展,情景管理系统在关键功能和性能上面临新的挑战。基于位置感知的应用是一个情景数据持久化需求较强的情景感知应用,需要保存数据进行稍后访问,情景管理系统的优化设计对于基于位置感知的应用的数据管理十分具有实际意义。本文将以基于位置感知的应用作为案例。形式概念分析(Formal Concept Analysis,简称FCA)是本文的主要优化理论。概念格是形式概念分析理论的基础模型,本文将概念格模型应用于情景数据管理中,其可以为收集到的情景信息进行层次建模,为相应的情景存储模型设计提供概念格索引加快查询。为了有效地将概念格模型应用到情景管理系统中,本文面向如下三个焦点:1.情景范围实例检索。目前很多情景感知应用在设计和实现中使用知识查询方式。在大多数应用中,底层情景预处理后可转换为高层次情景,这些高层次情景是具有语义的知识实例,用于后续查询和推理。目前,包括情景感知技术领域在内的很多领域都已经存在知识实例查询的方案。在情景应用中,基于情景范围的查询是查询方式之一。这类查询需要情景范围检索过程。有效的索引结构有利于情景范围检索过程。形式概念分析理论中的概念格是一种有效的索引结构用于信息检索,相关研究表明格检索具有基于属性项的对象检索、导航的优势。因此本文关注如何使用概念格进行情景范围实例检索。2.概念格索引存储。概念格索引存储的主要目的是为了持久化概念格用于后续查询,本文提出的概念格索引存储模型首先以保持概念格查询优势为主要目的,在此基础上进一步减少格存储空间。为了知识实例查询,本文的概念格索引存储设计应该支持知识层次的管理和读写。3.概念格索引中的情景知识一致性信息更新。在情景应用中,随着对象的不断被识别、加入和情景信息更新,概念格需要被更新。在更新概念格时,检查和更新概念格节点的知识实例的一致性信息,避免在后续查询时频繁检查节点中的对象,从而加快基于情景范围的实例查询。如果加快此过程,可更快提供后续查询新的一致性信息。因此需要设计相关的算法提高一致性信息的检查和更新时间性能。对于上述焦点,本文提出了以下的解决方案:1.基于概念格的情景范围实例检索算法。本文定义了知识相关的概念格结构用于实例检索和一致性判断。其按照本文定义的情景约束的元本体,可分析和抽取情景范围内情景约束关系,用于判断情景范围内知识的一致性信息。通过实例聚类,可生成概念格索引。为了使用概念格进行情景范围实例检索,本文提出了一个实例检索算法。实验结果表明使用算法提高了实例检索的时间性能。2.基于概念格的情景知识存储模型。本文提出了具有概念格索引的情景知识存储模型,并分析了其优势。为了保持概念格的检索优势,模型中的概念格索引存储模型按照概念格的原有结构进行设计。由于按照概念格的定义,外延存在对象交集,概念格索引存储模型通过使用键值对避免存储重复的对象。存储模型的实验结果表明通过使用键值对在查询外延的时间性能上得到了提高。3.概念格中的知识实例的一致性信息更新算法。为了减少概念格中一致性信息检查和更新过程的时间,本文提出如下两种算法:1)概念格一致性信息更新过程中的优化算法。主要功能:更新格;找到断言所属的概念格节点集,更新一致性信息;当不一致状态出现并且需要生成断言的一致节点时分割节点,产生一致节点。算法的目的是为了提高检查和更新格中的一致性信息的执行时间性能,如此可以使概念格更快提供新的一致性信息。本文首先提出了一个原始的概念格一致性信息更新算法,在此基础上进一步提出了优化算法。本文定义和使用了一些优化因子,目的是减少算法的执行时间。对于给定的一条断言,优化算法首先生成此条断言的一系列特别定义的过渡节点和Concept底节点,在局部格集中加入或者更新此条断言时,通过检查这些节点的内涵避免查找不需要加入或者更新该断言的局部格。在关于此条断言的一致性检查和更新时,通过自底向上的查找方式减少查找外延中重复的对象。Hadoop/HBase是本文主要的并行计算平台,优化算法用Map/Reduce形式实现并行化。通过实验和分析,和原始算法比较,随着对象数量增加,其执行时间性能得到了明显提高。2)概念格属性分割优化算法。分割节点的方法是对节点进行区间属性分割。但是区间属性分割仍然存在一定的时间消耗。在概念格一致性信息更新算法的基础上,此算法的主要目的是当不一致性情况发生并且需要执行分割时,加快区间属性的分割。本文提出的算法通过预计算属性的分割优先权,选择属性分割影响范围较小的属性候选项进行分割,从而降低时间成本。同时通过non-clone的方式并行生成和合并不同的子格,减少了新格的生成时间,non-clone方式保证内存不会因为并行生成的子格占据过多实际空间而溢出。本文分析了算法使用属性分割优先权的可行性。本文定义和证明了算法的并行分割优化理论。本文对并行优化进行了实验,作为概念格一致性信息更新算法的属性更新部分,新的优化算法和原始概念格属性分割算法进行了比较,在目前的测试集上,时间性能得到了明显提高。综合以上研究,本文的目的是为了使情景数据被有效组织、管理,在语义级别得到进一步的查询/存储优化。本文主要以形式概念分析为主要核心理论,结合Ontology、NoSQL等技术就三个焦点问题一定程度上优化了情景管理。在这些已有技术的基础上,就其他更多情景相关焦点问题,情景管理有待进一步深入研究和发展。