【摘 要】
:
随着信息技术及相关产业的发展,网上在线数据库已成为一个巨大的信息资源仓库,这些在线数据库信息不能被传统搜索引擎检索,只能通过向接口提交查询来获取,这些信息被称为Deep
论文部分内容阅读
随着信息技术及相关产业的发展,网上在线数据库已成为一个巨大的信息资源仓库,这些在线数据库信息不能被传统搜索引擎检索,只能通过向接口提交查询来获取,这些信息被称为Deep Web。为了让用户能快速、准确地找到所需的Deep Web资源,我们需要将Deep Web信息进行集成,并提供检索服务。模式匹配技术贯穿Deep Web信息集成的整个过程,本文首先对Deep Web及模式匹配技术进行了深入的研究,其次针对Deep Web的查询接口集成、结果语义标注过程中的模式匹配问题提出了一种基于本体的解决方法,最后对Deep Web接口集成原型系统进行了初步分析和设计。本文主要研究的工作包括:(1)首先介绍了Deep Web和本体的相关知识,然后对传统的模式匹配技术和面向Deep Web的模式匹配技术进行了深入分析与比较。(2)提出了基于本体的面向Deep Web接口集成的模式匹配方法,该方法将本体引入到了模式匹配过程中,基于标签、数据域、控件名称三种匹配思想,结合相似度合并策略及最大相似度优先算法,解决了接口集成中的模式匹配问题。(3)提出了基于本体的面向Deep Web结果语义标注过程的模式匹配方法,该方法将本体作为全局模式引入,有效解决了各个局部接口语义异构的问题。同时,本文提出在本体词汇、接口模式和结果模式之间进行交叉验证,用于提升标注的准确率。(4)本文最后设计和实现了一个面向Deep Web的接口集成原型系统。本文还对文中提出的方法和技术进行了实验设计,通过对实验结果的分析进一步验证了本文提出的技术方法是行之有效的。
其他文献
TTCN-3测试语言作为国际上唯一的测试标准语言,广泛应用于协议一致性测试,互操作性测试等测试领域。使用TTCN-3进行测试需要解决的一个重要问题就是测试适配器和编解码器的开发
近年来,随着社会经济和汽车工业的飞速发展,道路上的交通问题得到前所未有的关注。车辆自组网(Vehicular Ad Hoc Network, VANET),作为未来智能交通系统的基础之一,通过车与
XML是一种用于数据交换和共享的自描述语言,已经成为互联网上数据表示和数据交换的标准。在数据传输及交换过程中,许多结构化或半结构化数据都以XML格式来表示,由此产生了大
目前,互联网正在由传统Web的发布式站点逐渐向开放的,可读写的,交互丰富的Web2.0应用过渡,以适应个人用户逐渐参与Web站点的互动要求。传统的Web中的“点击-等待”模式,已经无法满
闪存作为一种新型的非易失存储介质,诞生于20世纪80年代末,具有高速、抗震、功耗低以及小巧轻便等优良特性。而且闪存作为一种纯电子设备,能够克服传统的机械设备所造成的一
近年来,数据的多样性使得传统的聚类算法已经无法满足数据分析的要求,于是人们提出了多视角聚类。现有的多视角聚类技术主要分为三类,协同训练算法、基于多核聚类算法和基于
IPv6替代IPv4成为下一代网络协议已是历史的必然。随着IPv6应用规模的扩大,针对IPv6的入侵方式层出不穷,现有的入侵检测系统不能适用于IPv6网络环境。为解决此问题,本文设计
我国拥有丰富的文物资源,但是对这些文物资源的保存却十分困难。在“大数据”的时代背景下,为了更好的对文物资源进行鉴赏、交流和保护,建立一个完善的数字化文物保护体系势
可信计算立足于终端,在终端构建一个信任根,以信任根为起点,通过完整性度量技术,建立信任链,实现信任由信任根扩展到硬件平台、操作系统,直至整个网络,保证整个计算环境的可信。
随着互联网的普及与应用,当前的计算机系统已经发展成为了复杂的、开放式的系统,这给社会的发展和人们的生活带来了极大的便利,但是网络规模不断扩大的同时也极大地促进了网