【摘 要】
:
信息产业的飞速发展,使得信息量飞速膨胀,面对海量的数据信息,怎样从中找到需要的有效信息,成为人们研究的热点问题。而随着数据的不断增加,准确而有效的查询变得越来越困难
论文部分内容阅读
信息产业的飞速发展,使得信息量飞速膨胀,面对海量的数据信息,怎样从中找到需要的有效信息,成为人们研究的热点问题。而随着数据的不断增加,准确而有效的查询变得越来越困难。不但数据中本身就存在一些相似相近的关键字,而且一些输入的错误、数据库中的“脏数据”也会给数据检索带来一定的困难。因此,模糊查询应运而生。目前,很多学者已经提出很多关于模糊查询的算法以及思想,但是,这些算法大部分都是基于前缀匹配的关键字的查询,查询的结果往往差强人意。本文提出了一种新的基于n-gram(即字符串片段)的模糊查询技术,该技术能够保证用户在输入错误或者数据库中存在“脏数据”的情况下,依然能够将有用的信息返回给用户。本文主要介绍了基于这种字符串分割技术的模糊查询的算法实现。主要包括字符串分割的算法实现、基于B+树结构的倒排索引的建立、输入预处理、通过多路归并算法从数据库中找到符合查询条件的候选者,以及最终通过编辑距离算法从候选者中找出符合一定编辑距离的最终结果返回给用户的具体做法,并通过实验平台证实了该思想的可行性。
其他文献
随着无线网络的发展,人们对基于定位的服务需求越来越多,尤其对室内定位的需求。但很多定位技术无法实现室内定位,再加上室内环境复杂,定位精度受很多因素的影响,如障碍物、
房地产作为我国的支柱产业之一,在我国的国民经济中占有重要的地位。而我国目前的房地产基本现状是楼盘分布广,房产价格变化快,因此对于一个购房者来说,如何及时方便地获取关
近年来设备状态检测和故障诊断技术迅猛发展,有效地保证了设备运行的可靠性,并在设备预知维修中发挥越来越重要的作用。计算机与嵌入式技术的不断发展又为状态监测与故障诊断
在网络技术日新月异变化的今天,网络已经应用到各个领域,网络安全成为一个全新的研究热点,如何快速、有效的针对层出不穷的攻击作出响应,对于保护网络系统和资源的安全变得更
随着互联网技术的迅速发展,个人数据呈现出了新的特点,即海量的规模、异构的数据形式和复杂多变的关联关系。与此同时,用户对数据管理的要求越来越高,传统的数据管理技术已不
金属凝固模拟技术因其相对完备的理论基础,被广泛应用于新材料及其制造加工等重要研究领域。随着科技的进步,金属凝固技术展现出蓬勃的发展趋势。然而,金属凝固模拟的物理试验总
随着半导体产品制造业的高速化和低成本化,机器视觉技术在电子产业的集成电路封装设备中发挥了越来越重要的作用。其中,装片机就是一种电子元器件生产厂家用于将晶硅片从料盘
随着虚拟现实、电子游戏等图形学相关产业的迅猛发展,流体模拟已经成为图形学领域中研究的一个热点问题。近年来,基于物理方法的流体模拟技术取得了很大的进展,并且得到了广
射频识别(RFID)作为一种高性价比的传感识别的使能技术,日渐在零售、制药、医疗保健和物流管理等领域得到各种大规模应用。然而,RFID数据具有时序性,动态性,数据量大,包含隐
城市地铁交通线路正在不断的发展建设,路网逐步形成并越来越复杂化,线路之间的耦合度也随之变高。由于线路广,资金难等特点同时聚集,地铁交通项目有很高的建设难度。目前我国各大