通过分析用户行为提高检索系统的查全率与查准率

来源 :中山大学 | 被引量 : 0次 | 上传用户:freeskykq
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  本文所采用的这样方法的最大特点是积累和利用系统使用者的经验和智慧,最大优势是通过对使用者检索行为的积累达到了系统能力自动积累和提高、自我修正的能力。   本文采用C#编程语言、.net开发框架、以XML文档作为数据存储手段,实现了一个Brower/Server结构的信息全文检索系统,并实现了“利用检索问题提高查全率”、“分类点击率提高查准率”、“利用相关关键字以帮助使用者提炼关键字以提高查准率”等创新方法和算法,并将它们与传统的检索手段作了比较详细的优缺点比较。   本文还做了其它一些相关性的工作:构建一个普通的检索系统、分析利用失败的检索过程来完善检索系统的方法、给出了传统的根据查询关键字出现次数提高查准率的一种实现算法、分析采用XML文档保存数据的优缺点、数据导入的问题。
其他文献
数字图像的压缩很长时间里是人们研究的一个课题,人们提出大量的图像压缩标准来适应不同的应用。压缩的任务是降低各种形式的数据的传输的带宽和存储要求。尽管现在越来越多的
目前,基于磁盘文件的数据库系统,例如BerkeleyDB、SQLite,虽然代表着嵌入式数据库应用的主流,但仍有一些应用场合的需要难以满足。它们所提供的库函数都是依托于文件系统的,所以,其
  本论文提出了一个在不降低基于错误实例系统准确率的前提下提高系统效率的方法:就是通过stringkernel、KPCA、K-means聚类等技术来提取系统错误实例数据库各个表的特征,为
语义分析是自然语言处理中的一个重要任务,语义角色标注(Semantic Role Labeling,简称SRL)是一种浅层语义分析的实现方式,它只标注句子中与谓词有关的成分的语义角色。目前,
本文提出了一个称为G2的高速图形引擎,它是专门为J2ME/MIDP类库的底层实现而设计的,例如可以使用在XORP/ORL系统中。  首先,是G2的专门性。与通用目的的图形引擎不同,G2是专门
公路规范查询与公式计算系统,主要针对当前的公路设计人员在设计过程中的需求而设计。公路设计人员在设计公路等过程中经常需要从大量规范标准中查阅技术标准、设计和施工规
Internet的迅猛发展、经济全球化时代的到来以及电子商务的广泛开展促成了机器翻译热潮。通常,用户通过购买相关软件或访问提供在线翻译的网站来获取翻译服务,然而,用户或者需要
非线性理论由三大理论构成:混沌理论、分形理论、孤立子理论。对非线性理论的研究常常以理论研究为主,本文在非线性理论研究的基础上探讨了分形自然景观模拟的应用。 分形
双语训练语料作为统计机器翻译系统的不可或缺的知识来源,直接影响系统的翻译性能。一般情况下,训练语料的增加可以使系统翻译性能上升。但是随着语料规模的增加,系统的训练
混沌现象普遍存在,它揭示了非线性科学的共同属性:有序性和无序性的统一,确定性和随机性的统一。近年来,随着对混沌理论研究的不断深入,混沌理论的应用已成为目前国内外关注的学术