Deep Web自适应跨领域查询策略研究

来源 :东北大学 | 被引量 : 0次 | 上传用户:zlongtime
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着Web信息的激增,Web服务器维护的数据库即Deep Web存储的信息越来越多,以尽可能自动的方式实现对在线数据库中信息的有效访问是目前Deep Web数据集成的主要目标。目前互联网中包含了大量的不同领域的Deep Web数据源,面向领域的数据集成技术也日臻成熟,出现了很多面向某一特定领域的Deep Web数据集成系统。本文假设所有的Deep Web数据源已经按照领域分好类,每一个类是所有该领域的Deep Web数据源的集成,具有统一的全局访问接口。目前,随着Deep Web应用的增多,用户跨领域查询已成为一种迫切的需求,本文要研究的是如何基于这些不同领域的集成类协助用户完成跨领域查询。针对这个问题,本文提出了一种自适应跨领域查询方法,具体来说包括(1)通过分析数据源查询接口属性名和后台Web数据库内容计算数据源间相关度,根据数据源间的相关度判定不同领域之间的关联性,基于领域关联性,构建领域相关性模型,获得领域关联图;(2)当用户查询到达时,基于领域关联图,构建查询树,根据数据源间的关联度获取用户跨领域查询路径,提出一个跨领域查询的查询路径综合评估模型(QPEM)对查询路径进行质量评估,推荐每关联领域对内top-k查询路径来满足用户多种可能的查询意图。本文以Web数据库的采样样本为选择数据库的依据,即首先根据Web数据库的样本选择满足用户查询的Web数据库,之后再对选择出的Web数据库进行真正的查询,从而使查询代价降低。另外,计算数据源内容相关度也是基于Web数据库样本来计算的。基于多因素决策的模糊评价模型提出的面向跨领域查询的查询路径评估模型(QPEM),从领域间数据源的关联度、查询树中父节点中数据源质量、父节点中数据源出度和子节点中数据源质量以及数据源的入度五个指标对查询路径进行综合评估。经过实验验证,本文提出的数据源关联性挖掘方法具有很高的准确率,同时针对查询路径的推荐结果,将四种标准化方法就用户满意度进行对比,研究了查询覆盖率对用户满意度的影响,实验结果表明本文方法对于跨领域查询路径推荐很有效。
其他文献
无线传感器网络技术被认为是21世纪最具有影响力的技术之一,已经被广泛的应用到了国防、工业、交通等诸多领域,成为了当前的研究热点之一,其安全问题也受到了广泛关注。与传
现代社会,生活节奏不断加快,在高楼林立的现代化城市中,电梯作为一种安全,高效的运载手段,己经遍及各种生活小区及产业园区。由于电梯的分布面广,运载对象众多,所以电梯成为了潜在而
随着Internet和Web服务技术的深入发展和普及,软件系统与网络的融合度越来越高,以网络为执行环境的软件系统规模、用户数量组成元素的交互频度都呈现出数量级的增长态势,成为
倒立摆是一种具有非线性、多变量、强耦合、欠驱动、自不稳定等特性的装置,可以直观反映控制理论中的稳定性、可控性、鲁棒性等许多关键问题,是研究和验证各种控制算法有效性
随着电子政务系统和电子商务系统的发展,信息系统的安全性需求越来越高。而确保信息系统安全的关键是对访问控制的研究。通过访问控制既可以限制对关键资源的访问,也能够防止非
教育资源建设是教育信息化快速发展的重要保证,但随之而来的是教育资源数量的剧增,为了避免教育资源形成信息孤岛,造成教育资源的重复建设,保障教育资源的全面共享,教育资源
在水环境监测领域,相比传统人工定时定点的监测方式,无线传感器网络技术以其覆盖范围广、自组织、价格低廉和实时性好等特点可以实现对监测区域全面的、实时的监测,因而逐渐得到
信息数据量的日益膨胀给数据处理带来了一定的挑战,据统计约70%的网络信息是以文本形式显现的。然而,此类信息数量很多而且杂乱,聚类技术能够在一定程度上对这些信息进行重新
计算机动画技术在图形设备的快速发展支撑下,已经在商用领域得到了广泛的应用。随着人们对动画需求的不断增长,计算机动画的生成效率也被赋予更高的要求,如何快速、准确地生成高
随着信息化的不断发展,电子政务信息化越来越重要。但目前政府各部门的应用系统由于各自的软硬件、开发环境不一样,导致了部门间系统环境的不一致、数据格式的不一致,部门之间各