图书领域Deep Web数据库选择方法研究

来源 :河北大学 | 被引量 : 0次 | 上传用户:zhaimeng2
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目前Web中存在大量可以访问的在线数据库,而且各数据库与用户特定查询的相关度不同,因此如何快速准确地选择出与用户查询密切相关的数据库变得越来越重要。在此,本文提出了一种基于信息检索的Web数据库选择方法。首先,在原有数据库选择方法的基础上做了相应改进,即在数据库选择之前,根据Web数据库的主题分布对数据库进行了分类,从而避免了对所有数据库进行查询检索,有效地提高了Web数据库的访问效率,且该分类仅是对图书领域进行地更详细的分类。然后,本文提出借助领域本体构建文本查询词,该方法充分利用了领域本体实例的唯一性及各属性信息,为通过文本属性进行Web数据库选择奠定了基础。接着,本文提出的Web数据库选择方法充分考虑了信息检索性能的各项评价指标,在结合原有评价参数的基础上做了相应改进,并提出了新的信息检索性能评价指标,实现了结构化Web数据库选择。改进的方法摒弃了原信息检索性能各评价参数的缺点,继承了其优点,而且改进的方法能够评价多个系统的性能水平。最后,在选择排序的基础上,通过设定阈值选择出既高效又准确的部分Web数据库。针对新的查询词,采用FP增长算法寻找被频繁查询的数据库,并将其作为Web数据库选择的默认候选对象。实验表明,本文提出的基于信息检索的Web数据库选择方法,在一定程度上提高了信息检索效率和查询准确度。
其他文献
随着社会进入大数据时代,信息充斥着社会的每一个角落,人们对于信息的迫切需求,必将推动着中文信息处理的快速发展。目前,中文信息处理经过了字处理阶段,词处理阶段后,已经进
匿名通信能够隐藏通信双方的身份,是一项重要的安全需求和应用。论文讨论了一种基于公钥加密的P2P模式下的匿名通信方案。本论文的研究成果主要包括:1.论述了国内外多种常用的
学位
VANETs:车辆自组网)是提高道路交通安全和效率的一种新技术。目前全球的机动车数量已经相当庞大,并且一直呈现上升趋势,导致VANETs系统的复杂性与日俱增。如何保证VANETs中数
电子邮件技术已经成为一种快捷、经济的现代通信手段,几乎每个网络用户都有自己的邮件信箱。然而电子邮件也日益成为商业广告、病毒、木马等内容的重要载体,垃圾邮件的泛滥成
语义Web作为下一代万维网的发展方向,自提出以来就得到了人们的极大关注。它不是另外一个Web,而是现有Web的延伸,其中的信息被赋予了良定义的含义,从而使计算机可以更好的与
信件和包裹的自动处理及自动分拣是现代邮件分发系统中一个重要的任务。目前,因为信封图像和包裹图像的获取和储存比起十年前更容易、成本也更加低廉,所以邮政自动化已经融入
现代电信主干网络采用先进的SDH技术和标准化的主流产品,但是由于成本问题以及复杂程度,使得其在边缘接入网络的推广成为难题。传统PDH技术和产品仍然满足和适合端局接入网络
随着新技术的发展和新设备的应用,应急通信系统越来越复杂。监控系统作为应急通信系统的重要组成部分,被监控的设备也越来越多,节点处理的信息量也越来越大。移动代理技术能
射频识别(]RFID技术是一种利用电磁波进行信息自动识别的通信技术。RFID技术被广泛的应用于物流,零售,图书管理等领域,但是由于RFID技术采用无线传输,使得RFID系统容易受到恶