搜索引擎技术的研究——基于后缀数组的搜索技术

来源 :西安理工大学 | 被引量 : 0次 | 上传用户:spaiwy
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
搜索引擎(Search Elngine)是随着Web信息的迅速增加,从1995年开始逐渐发展起来的技术。作为互联网上最主要的信息搜索工具,搜索引擎在各个领域都已得到广泛应用。然而,由于网络信息量迅猛增加和网络信息组织的无序性,人们对信息服务的个性化、智能化的需求也越来越高。这就给搜索引擎的研发设计人员提出了更高的要求。本文在传统的搜索引擎技术上对搜索引擎建立索引的技术加以改进,将后缀数组的概念引入搜索引擎中来。用后缀排序的思想对网络上网页数据预先建立索引,当用户输入一个关键字后就可以直接在索引中搜索。为了增加搜索引擎的准确性,还将数据挖掘中的数据分类技术和自动化中的用户负反馈技术引入进来,在用户挑选查询结果的时候,搜索引擎记录下用户的挑选结果。与此同时,搜索引擎通过数据挖掘提取出用户所选结果的共性,搜索引擎在依据此共性修正自己的搜索策略,如果用户对搜索结果还不满意,就重复这个过程,从而给用户提供更精确的查询结果。经过以上改进后,搜索引擎的搜索准确性得到大大提高,有很大的实用价值。
其他文献
森林火灾严重威胁着森林的健康,森林火险监测是保卫森林不受火灾侵害的重要方法。论文分析了森林火险监测的现状和目前使用的主要技术,这些技术中基于无线传感器网络(WSN)的
随着光纤技术的发展,特别是密集波分复用DWDM(Dense Wave length Division Multiplexing)技术的使用,使得光纤中能够传输更大的数据容量,满足大数据业务要求。因此以DWDM技术为核
人口问题是当今世界面临的重大问题,也是影响城市现代化建设的重要因素。人口与城市的基础设施建设、经济发展、生态环境保护紧密的联系在一起,影响着城市可持续发展的策略。但
具有真实感的三维人体造型和运动控制技术是计算机图形领域中的一项热门课题。它在虚拟现实、影视特技、游戏设计等众多领域扮演着重要的角色。随着计算机技术的不断发展,它在
个性化信息服务是在网上信息激增的背景下发展起来的,它包括基于合作的推荐和基于内容的推荐。 基于合作的推荐根据用户之间的兴趣相似性来推荐资源,它把和目标用户具有相
WebGIS是互联网技术和GIS相结合而产生的一种新技术,它利用Internet来扩展和完善GIS功能,是GIS研究的一个重要的领域。然而国内外的很多软件厂商所开发的WebGIS系统平台都使
随着数码产品的不断推陈出新,基于嵌入式操作系统的便携式媒体播放器(PMP)开发越来越受到各开发商的重视。它以其方便携带的特点,使得随时随地看电影成为可能。本文基于Windows
Ad Hoc网络是一种自组织的无线网络,它具有无线传输、高度的动态拓扑、无中心、多跳路由等特点。这使得它在某些应用场合具有独特优势的同时也提出了不少技术上的难题,其中路
医学图像检测和医学图像增强技术是当前图像处理领域研究的热点,本文在实际需求的指引下,根据东软医疗系统有限公司总体研究工作部署,作者先后参加了图像检测和图像增强技术两个
随着计算机的迅速普及,“以人为中心”的新一代人机交互技术成为当前研究的热点问题。手势识别是其中一个不可或缺的组成部分。尤其是基于计算机视觉手势识别的研究,因其符合