基于本体的检索模型的研究

来源 :安徽大学 | 被引量 : 0次 | 上传用户:flycondor
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着网络的快速发展,网络资源和信息也呈爆炸性增长。对于这些海量的信息,越来越多的人都愿意通过使用搜索引擎从网络上查找自己需要的信息。但是基于关键词匹配的传统检索系统由于缺乏对用户查询语言的理解,往往会返回给用户大量的无关的信息。所以,语义检索受到越来越多的关注。同时,语义Web和本体理论的提出和发展,也为语义检索的研究提供了基础。本文就是通过在对传统搜索引擎的研究的基础上,提出了一种基于本体的检索方法。通过对基于本体的语义检索系统的研究和认识,对一些传统的算法加以改进,并构建了一个基于领域本体的语义信息检索系统,将其与传统的检索系统进行了实验比较。本文主要工作内容有:1、根据现有的语料库,构建了一个关于计算机学科的领域本体。在创建领域本体的时候,还考虑了语料库中的本体概念和实例的共现因素。即构建的本体不仅是从领域科学的角度构建,同时还从统计的角度进行了考虑。2、在对文档进行预处理时,在采用了传统的TF-IDF算法的同时,还考虑了特征词在文档中所处的位置因素。3、在对用户的查询进行语义扩展的时候,本文采用的是基于本体的语义扩展,但同时也使用了局部上下文分析方法作为补充,以降低检索系统对领域本体的依赖性,提高系统的适用性。从最终的实验结果得出,该检索系统在保证查准率没有太大损失的情况下,对查全率较传统的检索系统有了很大的提高。由于本文只是基于领域本体进行的语义检索,对基于多领域的甚至通用本体的语义检索并没有过多的涉及,这将是我今后研究和工作的一个主要方向。
其他文献
随着第三方物流产业的蓬勃发展,从事第三方物流企业的市场竞争尤其激烈,企业要想在市场中生存并发展,提供高效、快捷、方便的物流服务至关重要。物流信息化能够帮助企业提高
人工免疫系统的研究旨在抽取生物免疫系统中独特的信息处理机制,研究和设计相应的模型和算法,进而解决各种复杂问题。人工免疫是继人工神经网络、进化计算之后新的智能计算研
无线传感器网络是一种全新的信息获取平台,具有快速展开、适应性强等特点,有着广阔的应用前景。基于无线传感器网络节点数量众多、密集分布、节点读数相关性高且能量受限等因
多关系数据挖掘是近年来快速发展的重要的数据挖掘领域之一。对于多关系的数据挖掘研究,如何高效地挖掘以及如何提高算法的可扩展性,一直是大家研究的重点。与传统的数据挖掘
组合测试是一种科学有效地软件测试方法,它能在保证软件质量的前提下,以较少的测试用例检测待测软件系统中各个变量以及它们之间的相互作用对系统产生的影响,实践证明其具有
随着社会交通运输的快速发展,越来越多的长途客货运驾驶员忙碌在工作岗位,因疲劳驾驶出现的事故频繁发生。因此,疲劳驾驶检测的相关研究意义重大。其中基于计算机视觉的检测
舵机最早出现在航模设计中,在航空模型中,飞行器的各种飞行姿态是通过调节发动机和各个控制舵机来实现的。而随着航空技术的发展,航空装备越来越复杂,对舵机的可靠性和控制要
近年来我国人民的消费出现快捷多样的特征,民众对时鲜果蔬、水产乳品等生鲜产品的需求逐年增加。采用全程低温运输以保证食品质量的冷链物流(cold chain)悄然兴起。但数据表
虚拟植物是指利用虚拟现实环境对植物的生长过程进行模拟的技术。虚拟植物是一个综合性研究课题,涉及到应用数学,计算机科学,农林学,生态学等学科理论,是当前的一个研究热点
指代消解是自然语言处理的重点和难点之一,在信息抽取,文本摘要等应用中都涉及到指代消解问题。待消解项识别是指代消解的一个子任务,是制约指代消解性能的关键要素之一,也是