倒排表相关论文
参考咨询是高校图书馆的一项重要工作,为了提高参考咨询问答系统的效率,在分析传统参考咨询问答系统的不足及倒排表的优势的基础上......
XML是网络上数据表示和交换的主要标准,提高检索效率和准确度是XML数据检索面临的主要问题.本文提出了一种以关键字检索为检索方法......
WWW上大量的XML数据,各种XML应用的出现,以及XML正逐渐成为Web上数据组织和交换的事实标准,都迫切需要合适的XML查询语言来查询相......
随着互联网信息的快速增长,搜索引擎的作用越来越重要。索引技术在网络服务中应用广泛,而索引系统是搜索引擎主要部分之一,它在搜......
学位
今天,随着信息时代的到来,存在着大量的数字信息.它们的存在增加了我们获得信息的方式.但也存在下列问题:(1)由于信息提供商的不同......
本文就中文全文检索的不同算法模型,特别是基于分词和基于单字的不同全文检索算法进行了比较,分析了各自的优缺点和实现的难点,针......
资源描述框架(Resource Description Framework,RDF)是W3C组织提出的描述万维网上资源的通用模型,该模型已广泛应用于诸多领域,如语义......
目前的搜索引擎大多是综合性的,收录各方面、各学科和各行业的信息,在反映专题或专业化信息方面很难做到全、快、准。因此课题完成......
目前,随着互联网的迅猛发展、Web信息的增加,用户要在信息海洋里查找信息,就像大海捞针一样,搜索引擎技术恰好解决了这一难题。然......
倒排索引是提高检索效率的重要技术,如何平衡倒排索引的空间效率、动态性能和检索效率是倒排索引面临的关键问题。本文主要围绕动......
全文检索系统支持快速从海量文本数据中检索信息,具有重要的应用价值。全文索引模型是全文检索系统的核心,它决定了全文检索系统的......
在设计TM中,系统的查询速度和易扩展性是很重要的.本文介绍了一种可用于TM的检索系统的实现,分析了该系统保证速度和易扩展性的特......
对于提高网络搜索引擎系统的性能而言,有效的存取倒排索引表和快速的响应搜索操作起着关键的作用,故提出了一种能够有效提高索引压......
为了提高网络中全文检索的效率 ,需要对Web页面中内容进行分析、建立全文索引 ,并对索引的结构进行高效率的组织。讨论了索引的组......
倒排文件是全文检索中广泛使用的索引结构,对静态文档集合建立倒排索引的研究已有较长时间。随着计算机技术的发展,需要存储的数据......
最频繁项集挖掘是文本关联规则挖掘中研究的重点和难点,它决定了文本关联规则挖掘算法的性能。针对当前在最频繁项集挖掘方面的不......
XML数据索引对其检索效率有较大的影响。在深入分析现有XML结构索引之后,结合XML文档特点,提出了一种基于关键字检索的结构索引—......
最频繁项集挖掘决定了文本关联规则挖掘算法的性能,是文本关联规则挖掘中研究的重点和难点。该文分析了当前最频繁项集挖掘方面的......
对全文检索倒排表技术作了较细致的研究。对全文检索的基本原理和技术进行了深入的探讨。对中文分词方法作了重点研究和总结,并对词......
跳跃索引是一种可信赖性索引,但只能为严格单调递增的序列建立索引,不能处理非顺序序列.为了解决这个问题,文中提出了一种新的索引,它可......
本文分析了评价搜索引擎中索引机制优劣的几个指标,针对XML文档的特点,设计了一个索引模块,给出了一种倒排索引方法。......
随着语义网络中数据量的激增,在RDF数据集中高效查询数据已成为一个亟待解决的问题。传统的基于物化视图的RDF模式匹配方法虽然能......
针对XML文件的特点,提出一种对XML文件建立索引的方法.该方法所采用的数据结构和算法,在充分利用XML文件的标记所隐含的上下文信息......
介绍了全文检索的概念及其中的数据预处理技术。结合安徽日报社新闻稿件采编系统和历史资料库系统实际情况,给出了一个新闻全文检......
路径表达式查询是XML数据查询处理的核心研究问题之一,研究者开展了大量的研究工作。但这些研究更多关注XML数据上路径表达式的匹......
无线环境的特殊性导致传统的关键字检索方法不能很好地用于周期数据广播之中。倒排表是全文检索中广泛使用的一种索引技术,但倒排......
搜索引擎在对网络资源进行适时定位时,往往疏漏同义词而导致所要信息的遗漏,这些问题引起了智能搜索引擎支持同义词查询的相关研究......
针对星型组查询只考虑了用户的位置信息和朋友关系,而没有考虑用户的偏好信息,使得推荐质量不高的问题,本文提出一种基于范围的星......
最频繁项集挖掘是文本关联规则挖掘中研究的重点和难点,它决定了文本关联规则挖掘算法的性能.针对当前在最频繁项集挖掘方面的不足......
针对通用数据库海量数据检索速度慢的缺点,文章提出了一个数据检索优化系统。该系统通过将海量数据拆分成短语和单词,利用哈稀算法......
对分词检索算法n-Gram/2L的索引结构作了改进,在第二级倒排表中加入对文章标识的索引,提出一种基于Zigzag的分词检索算法n-Gram/2L......
全文检索的应用导致了信息检索领域的一场革命,是文档数据库研究的核心。全文检索的首要问题是全文检索模型的选择。本文介绍了目前......
通过设计一个藏文图书查询系统,并给出该系统的总体结构图,对基于XML的搜索引擎中涉及的关键技术进行了研究,提出对XML这种半结构......
对倒排文件的组织与最佳归并进行较系统的分析,提出了例排文件的存储结构与实现的方法,倒排文件上的算法分析,最佳归并顺序的分析与论......
结构索引和倒排表在处理XML文档查询时,有不足之处。该文提出了一种结合结构索引、倒排表的策略、连接路径表达式的查询算法,有效地......
为提高XML文档的查询效率,提出一种基于倒排表与B+树的联合索引技术。DTD结构索引和内容索引采用倒排表作为索引单位,XML文档索引使......
随着信息技术的迅猛发展,数码产品的普及和因特网的深入人心。借助于计算机技术、网络技术和多媒体技术等,人们可以更加便捷地采集......
随着计算机技术和应用不断发展,人类面临着海量的数据。如何更好的利用好这些数据,以及怎么从这些数据中提取和挖掘出其中隐含的知......
随着Internet的不断发展,网络信息也成指数级的不断膨胀,这给信息检索带来了很大的困难,重复网页排除的研究工作是十分有意义的。......
互联网的快速发展给人们带来了新的获取信息和交流的方式。随着网站和网页数目的不断增加,为了用户能方便的访问它们,搜索引擎应运......
随着Web2.0与云计算的兴起,越来越多的企业选择NoSQL作为企业应用的基本架构。作为非关系型数据库的典型代表,mongodb被更多的选择,用......
针对推断网络(NBI)的二分图方法中只是考虑用户是否评价过项目,却没有利用用户评分高低这一局限性,提出基于偏好的推断网络(PNBI)推荐......