基于Storm的实时流式轨迹相似性算法的研究与设计

来源 :中国石油大学(北京) | 被引量 : 0次 | 上传用户:maye626
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
“互联网+”推动了移动互联网技术与现代产业相结合,在现实生活中的各种行为都可以被新兴IT技术转化为动态数据流,传统行业开始关注实时的、持续产生的动态数据,能够从动态数据中实时挖掘出知识和信息变得更为重要。在轨迹研究领域,对于实时轨迹相似性的研究是很多重要应用的基础,比如实时动态规划城市道路交通、实时抓捕犯罪嫌疑车辆等。因此基于Storm的实时轨迹相似性算法的研究是非常有意义的。考虑到实时轨迹数据具有实时性、持续性和无限增长等特点,传统的轨迹相似性度量算法无法满足对实时数据计算的需求。本文采用最小边界扇形算法将实时轨迹分割成轨迹段,并在原有的PDTW算法和LCSS算法的基础上设计了PDTW-LCSS自适应算法,在一定程度下解决了由异常噪声点和不同采样率等影响因素给轨迹相似性度量带来的问题,尤其提高了在轨迹相似性度量阈值边缘的轨迹相似性准确度。本论文针对PDTW-LCSS自适应算法设计并实现了基于Storm的实时轨迹相似性度量处理系统。在对轨迹相似性应用进行分析的基础上,采用Storm实时计算框架和Java技术作为系统支持。然后从实时轨迹相似性度量需求出发分析和构建系统架构,设计并实现原型系统。最后采用Zookeeper搭建集群,协调Storm工作节点,对基于Storm的实时轨迹相似性度量系统进行了测试和分析。根据实验结果显示,PDTW-LCSS自适应算法具有很好的准确度。
其他文献
跨入信息时代以来,中国的数据库研究不断取得进步和发展,从20世纪90年代以来,中国逐渐形成了以CNKI、万方数据库、维普数据库为主的三大数据库。因此,文章首先简单介绍了数据
硅藻休眠期细胞(包括休眠细胞和休眠孢子)的形成被认为是硅藻为适应不良环境,维持硅藻种群生存的一种有效策略。休眠期细胞的一个突出特点是细胞壁重硅质化,从而增加了细胞下沉率并保持存活。但涉及休B眠期细胞形成过程的硅代谢、抗氧化机制、以及能量供给等分子调控机制一无所知。本实验以海洋中心纲硅藻假微型海链藻(Thalassiosira pseudonana)为研究对象,从生理测定、生化检测,以及转录组学三方
近年来,随着生活水平的提高,由心脑血管病变引起的各种疾病的发病率正在逐年上升。而临床研究发现,在许多心脑血管疾病发病早期,动脉直径会发生显著变化,从而引发管壁弹性减
<正>恐惧症是一种以过分和不合理地惧怕外界客体或处境为主的神经症。病人明知没有必要,但仍不能防止恐惧发作,恐惧发作时往往伴有显著的自主神经症状。病人极力回避所害怕的
会议
《中共中央国务院关于坚持农业农村优先发展做好“三农”工作的若干意见》,即2019年中央一号文件19日公布。文件重点部署了哪些任务?如何确保农业农村优先发展?新一轮农村改
<正>目前,驻马店市工商登记在册的家庭农场已超过6000家,经省级认定的示范型家庭农场9家。家庭农场与专业大户、农民合作社、龙头企业共同组成了当前农业规模化、商品化、组
以武汉天兴洲公铁两用长江大桥正桥Ⅰ标段0-022号宽墩铁路简支箱梁40m下行式移动模架施工为例,简要介绍40m下行式移动模架的结构特点,并对40m下行式移动模架支架法拼装、铁路简
目的探讨早期护理干预对维持性血液透析患者动静脉内瘘并发症发生率的影响。方法选择2012年8月至2015年1月来江西省新余市新钢中心医院接受治疗的维持性血液透析患者96例作为
中国经济的持续高速增长到达了瓶颈期,同时国内正在经历大力反腐阶段。文章在疏理以往研究腐败与经济增长的文献的基础上,建立计量经济模型,运用1998—2007年31个省的面板数
生物数学是一门较新的学科,其目标是从数学的角度研究生物学中的实际问题.而传染病模型在生物学研究中尤为重要.由于大多数传染病反应扩散系统都是非单调的,这就导致对该类问题的研究具有一定的困难.本文主要研究了几类传染病模型的行波解及相关问题.本文第二章提出了一类具有饱和发生率的传染病格微分模型,并证明了一定条件下最小波速C*的存在性.首先,通过构造一个截断问题并结合不动点定理证明了当C>c*时,系