论文部分内容阅读
随着室内定位技术的发展和具有定位功能的移动设备的普及,越来越多的室内移动对象的位置数据可被记录下来,合理高效地管理这些海量性的移动对象数据,对推动室内移动对象相关研究和发展室内LBS服务有着重要的现实意义。随着移动对象分析研究的深入,越来越多的学者开始关注移动对象运动背后的语义信息,分析对象从空间几何信息到语义信息的转变,要求移动对象模型能够合理的表达移动对象位置的语义信息,移动对象索引能够快速地回答语义相关约束的查询。目前的移动对象管理方案主要存在两个问题:一是现有的移动对象模型多数是物理位置模型,这种空间维添加时间维的模型不能表达语义信息,因此建立在此类模型基础上的索引结构不能有效回答基于语义的查询;二是随着移动对象数据的爆炸式增长,传统的移动对象数据库在数据量、更新效率、查询效率上均难以满足现实需要,需要寻求基于应用于大数据场景的NoSQL(Not only SQL)数据库如HBase的解决方案。 本文在总结已有研究工作的基础上,针对目前研究的不足,以应用分析为导向,结合室内移动对象特点,基于SMoT(Stops and Movings of Trajectory)模型提出室内移动对象的语义位置模型,提出利用定位点-语义面的空间包含关系对移动对象的物理位置语义化处理的方法,将移动对象的轨迹抽象为一系列的语义停留点。随后,本文设计了空间位置-语义多层的移动对象索引结构,其中空间索引层负责快速语义化位置数据,语义层索引实现语义空间范围检索和移动对象的语义轨迹检索。空间索引采用Grid索引结构并完成从索引结点到室内语义单元的映射,通过牺牲一定判断准确度的代价,将移动对象位置语义化的速度提高了两个数量级;语义索引层基于HBase实现,可以进行高效地语义范围检索,并通过HBase的二级索引实现了移动对象的语义轨迹索引。面向语义的索引设计提高了语义检索的效率,方便了后续的分析过程,基于HBase的实现方案不仅提高了数据的更新效率,还能够应对海量性的数据规模。 在数据分析过程中,针对语义轨迹模型,本文提出依据停留时长的停留间距离度量算法,并借鉴Douglas-Peucker简化线算法提出语义轨迹的关键停留提取算法,随后文章对室内语义单元的统计量、停留点的关联规则、语义轨迹的频繁序列模式进行了探索性分析,相较于轨迹数据的几何分析方法,语义轨迹分析不仅简单,并且能够对分析结果给予一定的意义解释,代表了今后移动对象分析的发展方向。 本文通过试验性研究,探索了基于HBase的室内移动对象管理方案,支持语义的移动对象索引为数据分析工作提供了便利,同时也为相关研究奠定了的基础。