支持压缩数据的近似子串查询处理技术的研究与系统实现

来源 :东北大学 | 被引量 : 2次 | 上传用户:blackcat
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着社会的发展,各种信息数据的总量正在不断的扩大。数据量的激增给数据的保存和使用都带来了巨大的压力。为了解决数据规模的增加与存储空间的矛盾,高效的压缩算法被相继提出。数据查询技术在各个领域都是必不可少的,然而数据压缩技术却给数据查询带来了巨大的挑战。如何针对压缩数据进行数据查询成为本文的主要研究内容。本文首先对近似字符串查询处理技术进行了综述。基于最新的一种数据无损压缩技术,提出并设计实现支持压缩数据的近似子串查询技术。这种无损压缩技术利用字符串数据之间的高相似性,实现数据压缩。为了对数据进行高效的查询,对压缩数据采用了高效的B+-tree结构和先进的倒排表索引技术,根据倒排表索引提供的信息可以快速进行查询定位,B+-tree结构可以快速完成信息的获取,通过对这两种索引技术的改进使之可以应用于近似子串查询算法。提出了高效率的相关过滤方法,最后提出并设计了完善的近似子串查询算法。基于上述理论研究并实现了近似子串查询系统,对系统的可行性、功能需求以及性能需求都做了详细的分析,采用B/S架构设计该系统,使用户通过网络进行使用。运行测试和性能测试表明该系统基于压缩数据,节省了大量的空间代价,并可以保证查询时间的有效性。同时可以提供稳定的对外服务。
其他文献
随着移动通信技术的进步和智能手机操作系统的发展,手机电视应运而生,而其所带来的无所不在、无时不在的视听享受倍受用户青睐。内容提供商、网络运营商、终端设备提供商纷纷
图像质量评价标准在图像和视频编码里是一个非常重要的课题,它不仅是衡量图像视频压缩算法效果的指标,而且是编码率失真优化的准则。而由于基于主观感知的图像质量评价标准对
本文主要研究了以太网环境下的数据链路层拓扑发现问题。在目前的研究中,大多数拓扑发现是基于使用SNMP协议查询以太网交换机的拓扑相关信息。然而,使用SNMP协议存在着一些问
交叉路口是城市交通的瓶颈之一,减少车辆在这些节点上的等待时间可以有效提高交通系统的效率。本文首先介绍了最新提出的基于预留技术的Multiagent交叉口车辆控制系统(Reserv
随着信息时代的到来,网络在人们生活中的重要性越来越大。而不管网络中各种技术怎样革新,人们都需要从海量数据里面找到自己所需要的信息。由此可见无论技术怎样进步,搜索引
如何从物体的二维图像中恢复三维结构,即三维重构,是计算机视觉技术研究领域中的重要问题。而其中的单幅未标定图像的三维重构问题更是近十年来的研究热点,被广泛应用于虚拟
随着计算机网络技术的发展与应用,网络协议日益复杂,协议开发过程中任何一点错误都将给分布式系统的稳定性、可靠性、坚固性、安全性、容错性以及异种系统之间的互通性带来巨
统计机器翻译使用统计方法自动地把一种自然语言的文本转换成另一种自然语言的文本。最近,统计机器翻译研究者开始关注融合语言学信息的翻译模型。在这些模型中,基于树到串对
冗余容错机制在容灾备份系统中起着极为重要的作用。在完全的数据复制和磁盘阵列这两种冗余容错机制之外,近年来,纠删码和纠错码在这方面的应用得到了广泛的关注。与其他机制
并行计算是实现高性能计算的有效途径,经过几十年的发展,并行计算已经广泛地应用于工程设计、科学计算和计算机系统等领域中。在现有硬件的基础上,为了提高并行计算的效率,负