移动互联网中主动数据处理技术研究

来源 :哈尔滨工程大学 | 被引量 : 0次 | 上传用户:spredsheng
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着移动互联网、云计算、移动通信等技术的发展,Internet上海量数据已呈几何级增长,大数据时代已经开启,分布式系统的规模和架构也因此发生了极大改变。互联网上数据多由半结构化XML表示,XML已成为大数据信息交互、存储的格式标准。作为个性化智能服务基础平台的分布式计算既要具有良好的扩展性,还需在动态、异构、分布的互联网资源中达到高度的适应性。发布/订阅系统的多对多、动态即插即用、松耦合、异步通信等特点及高度适应以信息为中心的动态网络,可处理移动互联网络环境中的海量数据。在飞跃式发展的移动互联网环境下,处理复杂结构的实时主动数据流成为研究热点。传统的发布/订阅系统缺乏对订阅请求语义层面的理解,过滤匹配结果可能包含不相关信息,同时对订阅中含不确定元素无法精确判断,因此在表达能力、过滤处理、扩展性等方面存在问题。本文针对移动互联网环境下可处理海量信息的分布式发布/订阅系统进行研究,主要从数据处理和过滤匹配两方面分析探讨,并提出更有效的算法。本文首先对主动数据进行预处理,提出一种XML相似度计算方法。通过深入研究移动互联网环境中发布/订阅系统中移动性终端和代理节点所接收的XML数据特点及相似度计算的理论基础,分析归纳相似度计算研究中的不足,提出一种XML文档相似度计算方法,该方法能够计算任意XML文档间相似度,可在过滤匹配预处理阶段快速对数据流分类,提高发布/订阅系统的准确性和效率。其次,在相似度计算作为预处理的基础上,提出基于后缀树自动机过滤匹配算法。该算法利用树自动机技术,引入后缀思想,采用无秩树自动机的自底向上push模式方法,处理含有子孙轴和不确定元素复杂结构的订阅请求,能够有效减少数据处理过程中大量相同转移的中间状态,避免了状态集的重复计算。最后,针对本文提出的算法与经典发布/订阅系统过滤匹配算法进行分析比较,并得出仿真结果。仿真实验结果表明:在表达能力、效率、处理不确定因素的能力及扩展性等方面,本文提出的算法均优于其他经典算法。
其他文献
受限于地理位置、气候等因素影响,不便于采用真实雷达开展教学。使用雷达模拟器进行实训教学是一种可行的手段。以高程数据作为雷达仿真图像的底层数据,优点是精度高,应用灵
电话口译是现如今常见的一种语言服务,主要以三方交谈的方式进行。因其不受地点限制,方便灵活且设备简单等特点越来越多地被应用。本文是一篇电话口译实践报告,主要描述了作
随着全球化的飞速发展,国际贸易在我国经济中所占比重不断加强,翻译在商业中发挥着越来越重要的作用。联络口译作为一种典型的口译方式在诸多领域广泛应用,包括外交、商务、
生产调度问题在现代的生活中得到广泛的应用,应用于社会生活中的多个领域,如工厂加工生产制造、钢铁铸造、淘宝、物流、网络通讯、计算机科学与技术等。经典调度问题在现实生
现今社会,国际交流日益频繁,宽带互联网使用便利,视听技术发展快速,这不仅为远程口译的发展奠定了良好的技术基础,而且提供了巨大的需求市场。近年来,作为一种新型的远程口译
贸易成本,指的是商品生产出来到传递至最终消费者过程中所产生的所有成本,它是决定贸易行为能否发生的重要因素。Deardorff(2004)认为,在存在贸易成本的情况下,传统的比较优
随着移动通信的发展,视频业务通信量呈爆炸式增长,给视频业务无线传输带来了前所未有的挑战。作为目前最热门的视频技术之一,DASH技术受到了国内外研究者的广泛关注。其码率
无线通信技术的飞速发展使得无线频谱的重要性与日俱增。无线频谱资源是一种短缺的、无法再生的公共资源。如何有效分配与合理使用该资源正成为学术与工业界研究的热点。拍卖
目的研究纳米羟基磷灰石/胶原即矿化胶原(nano-hydroxyapatite/collagen,NHAC)与镁钙合金(Mg-Ca)的联合支架材料应用于体外细胞实验中的生物相容性及其用于犬拔牙位点保存的
目的制备负载神经生长因子(NGF)的可注射壳聚糖透明质酸复合水凝胶,探讨其理化性能以及生物相容性。方法京尼平交联制备壳聚糖透明质酸复合水凝胶材料,采用倒置法检测复合水