论文部分内容阅读
随着信息技术的不断发展,物联网技术逐渐被社会各界所重视,在工农业、智能家居、快递物流、设备监控等各方面都有着广泛的应用。物联网中包含很多实体,导致物联网包含了海量的实时数据。如何对物联网中海量的实体进行处理分析,如何从这些海量实体返回的实时状态数据中搜寻得到有用的信息以及如何通过这些已知信息来预测未来未知的状态成为了物联网研究中的重点。本文针对物联网中实体搜索进行了研究,实现了物联网中实体信息的实时搜索。首先,在实体架构及实体数据源获取方面,采用MetaSeeker工具和Watir与Nokogiri两种方法同时实现,基于MetaSeeker信息实时获取方法通过页面实时监测机制,只要物联网页面实体信息有变动,就能实现实时抓取,对系统的占用较少;Watir与Nokogiri信息实时获取方法主要通过Watir实现对物联网动态页面加载,然后采用Nokogiri对获得的HTML文档进行解析并获取网页的HTML文档内容,再通过CSS Selector来找页面上所需内容的节点,取回该时刻的页面文本信息,从而实现固定周期抓取物联网动态页面实时信息,获取实体信息。针对物联网实体的搜索问题,本文采用Lucene搜索框架实现,Lucene对获取到的实体数据进行解析,建立索引数据库,将建立好的索引库存入本地文件。之后通过检索索引库实现搜索功能。由于Lucene具有强大的搜索功能,对海量数据搜索耗时很短,能满足物联网实体搜索实时性的要求。物联网实体信息实时获取部分虽然实时获取到了物联网中实体的信息,但由于物联网信息的高动态性,数据具有瞬时性。为了更好的实现实体搜索的实时性,本文在搜索模块后面扩展了预测分析模块,采用周期预测模型,包括聚合预测模型(APM-AggregatedPrediction Model),单周期预测模型(SPM-Single-period Prediction Model),多周期预测模型(MPM-Multi-period Prediction Model);通过判断物联网实体事件的周期模式采用合理的预测模型,预测出物联网中实体状态的概率值,从而使得实体搜索更具实时性。为了验证实体搜索及实体预测的实时性与准确性,采用美国三菱电子研究实验室MERL的传感器数据集和美国明尼苏达州交通数据集TDRL进行实验。实验显示,本文能够从海量实体数据中以较短的时间搜索预测出较准确的结果,从而对用户的决策起到了很好的指示作用。