【摘 要】
:
信息检索技术是当前最热门的研究课题之一,它主要研究如何从海量信息中快速准确的查找到用户需要的信息。但在实际应用中,由于用户查询描述方法的局限性,系统返回的检索结果
论文部分内容阅读
信息检索技术是当前最热门的研究课题之一,它主要研究如何从海量信息中快速准确的查找到用户需要的信息。但在实际应用中,由于用户查询描述方法的局限性,系统返回的检索结果常常不能很好的符合用户的检索要求,造成检索准确率过低。本文以此为背景研究并实现了基于用户反馈的查询扩展系统,为解决这一问题提供了一个新的思路。查询扩展技术是对信息检索技术的一种补充和延伸,论文分析了查询扩展相关技术的发展、特点和关键原理,并分别论述了当前主要的查询扩展技术及典型系统。论文以网页文本信息为研究对象,实现了基于用户反馈的查询扩展系统。由于在本系统中采用文档摘要为依据判断文档相关性并提取查询扩展信息,所以本文对自动摘要的实现也进行了重点的研究。通过文档摘要,可以更加直接、准确、快速的获取用户的反馈信息,并生成用户兴趣模型。并且,为了能够全面而有针对性的表达用户兴趣,本文建立了多级用户兴趣模型,分别表达用户不同阶段、不同特征的用户兴趣。最终,通过用户兴趣模型,系统完成重新计算文档权重以及提取扩展查询词两项工作,从而提高了检索系统的查准率与查全率。实验测试证明了系统的准确率高于传统查询扩展方法,并且系统同时考虑了临时用户和注册用户两类用户的不同需求,具有较高的实用性。
其他文献
自然现象的模拟是近十几年来计算机图形学的一个重要研究领域,自然景物的渲染是图形学技术研究中的一个重点和难点之一,如何构造结构复杂、形态变化的物体是计算机图形学的一
计算机技术、多媒体技术以及Internet技术的长足发展导致了大量图像的出现,如何有效地、快速地从大规模图像数据库中检索出所需的图像是目前一个相当重要又富有挑战性的研究
目前因特网使用的核心协议IPv4是20世纪70年代末设计的。无论从网络规模还是从传输速度上看,IPv4协议的不足渐渐显现出来。其中最主要的问题在于32bit的IP地址不够用。为此,I
随着医学成像技术的发展,医学影像已经成为一项极其重要的诊疗技术。然而,随着数字化医疗设备如CT、MR、DSA、DR在临床医学诊疗中的大量应用,以及计算机技术在医疗中的迅速普
近年来,随着信息技术在教育领域的广泛应用,各种各样的智能教辅平台迅速发展并吸引了大量的用户,逐渐成为了学习者进行知识构建和协作学习的主流学习环境。与传统教育相比,智
随着多队列万兆网卡的普及,内核网络包I/O子系统的低效性越发突显。学术界和工业界为了解决这一问题而提出的高性能用户空间包I/O框架逐渐成为构建高性能网络系统的基础。然
随着计算机互联网技术的飞速发展,计算机网络在给人们带来极大便利的同时,各种网络入侵与攻击也接踵而至,入侵检测系统就充当了抵御网络入侵的武器。一方面,随着计算机网络高
序列模式挖掘是从大型时序数据库中发现事件之间存在的隐藏的、有趣的序列关系,挖掘出基于时间或者其它顺序的出现频率高的频繁序列模式。它弥补了关联规则挖掘不能反映事件在
在过去几十年里,传统的关系数据库管理系统(RDBMS, Relational Data-Base Management System)在数据管理方面发挥了重要的作用。但是,近年来随着计算机应用技术的不断发展,数
图像变形根据一定的变形函数将源图像映射到目标图像以产生图像的局部变形,该项技术可以被广泛应用于虚拟现实、动画、医学图像处理以及影视娱乐等各个领域。映射分为正向映