文献检索引擎技术的研究与实现

来源 :贵州大学 | 被引量 : 0次 | 上传用户:xqiqi
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网技术的迅猛发展,文献这一信息资源总量正呈指数级不断增长,其更新速度也在不断加快,如何有效地获取并利用这些资源便显得更为重要,于是各种各样的文献检索平台也不断地涌现出来。当前国内外的文献检索系统普遍基于关键词匹配的原则,仅仅简单地采取逻辑“与、或、非”的方式对检索词孤立地进行匹配,不能有效地反映出用户真正的检索期望,从而导致检索结果精度不高。因为在目前的文献检索系统中检索结果常以随机形式显示,这进一步加大了用户获取期望文献的难度。另外,在索引建立过程中,单一地采用分词索引技术或单汉字索引技术,造成检索引擎的查全率较低或索引文档过大(影响检索引擎的检索效率)。因此,本文针对以上问题进行了相关研究。研究内容和取得的成果主要体现在以下两个方面:·提出一种新的混合索引方法,该方法充分利用了基于单汉字索引技术的优点,保证了检索引擎的高查全率,同时根据单汉字在文献中出现的逻辑位置,利用分词索引提供的含有该字的词对其进行替换,以减小索引文档的大小,保证检索引擎较高的检索效率。·提出一种基于文献检索期望值的检索结果排序算法,该算法充分考虑了用户的检索习惯、汉语的特点、文献中各部分对内容的反映程度等因素,采用文献检索期望值作为衡量文献内容与用户检索期望之间相关度的指标,并对其建立数学向量模型,对检索结果文献的检索期望值进行定量计算,最后对该值进行降序排列,将相关度最大的文献结果显示在前面,以更好地满足用户的检索需求。本文所提出的混合索引方法和基于文献检索期望值的检索结果排序算法已经应用到科技文献异构数据库共享检索平台中。在模拟真实的环境下,通过实验和对文献检索结果的分析,表明本文研究的内容是正确的、有效的。在不影响检索系统响应时间的前提下,能够有效地提高文献检索引擎的查全率和查准率,具有较好的应用价值和广阔的应用前景。
其他文献
随着社会不断发展,人们的生活环境发生了翻天覆地的变化,城市建设及规划的需求越来越大。在城市建设过程中同步会形成大量的记录文件,因而如何有效地管理城建档案成为了工作
互联网时代的到来给大学生集体主义价值观的形成和培养带来了极大影响。本文立足客观现实,分析了网络的特点,并对集体主义价值观进行了科学的阐述,在此基础上对网络给大学生
【正】 一年来,我国的理论界和实际工作者围绕第三产业的性质、范围和产值统计等问题,展开了广泛而热烈的讨论,提出许多不同意见,其中有些是新的颇有见地的意见。这充分表明,
数学课是小学教育体系中非常重要的课程之一,学好数学有利于培养学生的理性思维,对学生未来人生道路的发展有着重大影响。然而,数学课往往具有较强的理论性与抽象色彩,对于年
教学是一个双边的过程,并非完全在教师的预设下再现,会因受教育者个体的不同状况而出现多样化的生成内容。学生在学习的过程中亦会出现这样那样的错误。面对错误,诸多教师采
近年来,新宾满族自治县深入贯彻习近平总书记关于脱贫攻坚工作的重要指示批示精神,认真落实中央及省委、市委关于扶贫开发工作重大战略部署和抓党建促脱贫攻坚具体要求,树牢
【正】 旅游是人们旅行游览的一种娱乐活动,旅游业是为人们旅行游览提供方便和服务的行业。以它投资少,见效快,获利高,增加外汇收入等特点,被誉为“无烟工业”和”无形贸易”
为了解决高职院校公共机房维护难、服务质量难以提高和重复建设等问题,根据云桌面技术不同模式的优缺点和适用场景,根据该校的现实问题和实际需求,设计了一个基于IDV模式的云
接受美学理论为中学语文阅读教学提供了学科理论上的指导,也为中学语文阅读教学提供了一个新的思路和角度。本论文试图在接受美学的“期待视界”、“召唤结构”、“视界融合”
目的:探讨哮喘患儿吸入性过敏原种类、过敏原分布特点,以及与患儿年龄、性别的关系,为哮喘儿童的临床诊治及预防提供理论依据。方法采用丹麦 ALK-ABELL 公司提供的13种标准化变