个性化信息检索技术的研究与实现

来源 :中国航天第二研究院 航天科工集团第二研究院 | 被引量 : 0次 | 上传用户:wgp121554715
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网技术的迅速发展,网络上可用的信息资源呈现爆炸式增长,给人们带来便利的同时也带来分辨信息类型的难题。传统信息检索系统满足了人们对检索的基本要求,但却逐渐暴露出“信息过载”和“资源迷向”等问题,无法满足人们日益增长的个性化需求。造成这种问题的主要原因是:一方面传统信息检索系统返回的是大量的通用性的检索结果,这些结果远远超过了用户所能接受和处理的能力,其中大部分结果并不是用户需要的;另一方面由于检索用户和网络文档对同一概念的表达形式往往会有差异,这导致检索结果并没有完全包含用户所需要的信息。面对上述存在的问题,寻找一种新的、能够体现用户个性需求的检索方法也就成了当前信息检索和个性化服务领域的一个研究热点。  本文的主要研究目标是建立用户兴趣模型,并用这个模型记录和更新用户的兴趣信息。由于传统的用户模型的构建方法具有表示形式私有性和缺乏对语义的有效支持等缺点,因而本文将会基于领域本体来构建用户兴趣模型。本体是共享概念模型的明确的形式化规范说明,是某个领域内的概念及其关系的集合,基于本体的用户兴趣模型的表示方法可以有效的解决传统用户模型在表示方面的问题。  本文首先介绍了个性化服务、信息检索技术和本体技术的理论基础;接着重点研究了用户兴趣模型的兴趣获取、模型表示、模型构建,提出了基于本体的用户兴趣模型的表示、构建与更新方法并利用中文本体构造管理器构造了军事武器装备领域本体;然后对本文用到的一些主要算法进行了阐述,主要有:领域本体的概念语义相似度计算、查询词扩展和兴趣度量算法;接下来给出了个性化信息检索原型系统框架并对每个功能模块进行了详细分析;最后在系统实现部分用一些实例验证了系统的有效性。
其他文献
数据挖掘技术是解决当前社会“数据丰富而知识贫乏”问题的有效途径。数据挖掘任务种类很多,其中关联规则挖掘是目前研究和应用最广泛的课题之一。  关联规则挖掘的任务是在
该文对软件体系结构(Software Architecture)进行了较深入的研究和分析,包括体系结构的概念及它在软件设计中的位置、体系结构的风格分类、如何从不同角度描述软件体系的结构
该文围绕DM2上数据仓库的实现问题展开了讨论,主要研究了监控器和集成处理器的实现问题.文章首先介绍了数据仓库的产生与发展概况,然后介绍了DM2上数据仓库的体系结构,紧接着
该文提出在Linux上实现基于IP层的VPN的方法,其基本思想是对IP层的网络流量进行加密和验证来保护在公共网络上传输的私有信息的完整性、机密性和可用性.首先简要分析IPSec协
概念格作为形式概念分析理论中的一种核心数据结构,是近年来获得飞速发展的数据分析的有力工具.在知识发现的过程中建造与应用概念层次结构进行知识获取方面具有很多的优势,而
随着深亚微米的半导体制造工艺得到广泛应用,超大规模集成电路(VLSI)集成度迅速提高.在电子设计自动化(EDA)领域,检验电路设计正确性的传统方法--模拟验证方法,已经不可能对
随着电信技术的发展,因特网电话迅速进入实用阶段.追述因特网电话的发展历程,大家可以看出以IP技术为代表的计算机通讯技术逐渐被传统电信行业所采用,推出了一些新的电信服务
IP协议是当前网间网互联事实上的标准.该文论述如何参考IP协议的设计思想,根据一个具体应用系统的需求,利用层次形树状网络拓扑结构的特点,开发一个针对性很强的网间网协议MT
该文从空间关系理论、空间查询语言和空间索引机制等几个方面对空间数据库技术进行深入的研究,从理论上提出了一些新的研究思想和算法,并设计和实现了空间DBMS原型系统DM-SDB
该文总结了近年来在数据库管理系统的可视化方面的研究发展,并在此基础上进行了空间数据库可视化查询、数据可视化显示的研究,并将其应用于国产分布式多媒体数据库管理系统DM