【摘 要】
:
因特网的迅猛发展,给人们带来了海量的信息,这些Web信息大部分隐藏在各类在线数据库中,只有通过查询接口才能获取,因此被称为Deep Web。由于Deep Web信息增长速度快、质量高
论文部分内容阅读
因特网的迅猛发展,给人们带来了海量的信息,这些Web信息大部分隐藏在各类在线数据库中,只有通过查询接口才能获取,因此被称为Deep Web。由于Deep Web信息增长速度快、质量高、覆盖面广,已成为人们获取信息的重要来源,为了让人们方便、高效地利用这些资源,我们需要对这些Deep Web信息进行集成。Deep Web查询接口的模式抽取和匹配是信息集成的关键。本文针对Deep Web查询接口的模式抽取和匹配技术进行深入学习和研究,提出了相关算法和解决方案,有效地解决了现有方法的局限性。本文主要研究工作如下:(1)介绍Deep Web相关知识和国内外研究情况,然后对传统的模式匹配方法和面向Deep Web模式匹配方法进行比较和分析。通过总结现有方法的优缺点,力求从中探索出新的模式匹配思路和方法。(2)针对现有模式抽取方法对接口结构特征忽略的问题,提出一种基于空间聚类的Deep Web查询接口模式抽取方法。该方法结合查询接口中元素的空间位置关系,将元素块之间的最小欧式距离作为参考依据,以聚类方法为基础,解决了Deep Web查询接口模式中逻辑属性的抽取问题。(3)针对大规模查询接口模式匹配的低效率问题,提出一种基于关联矩阵的Deep Web查询接口模式匹配方法。该方法将查询接口模式转换为正负关联矩阵,并利用正关联矩阵挖掘组属性,负关联矩阵挖掘同义属性,高效解决了Deep Web查询接口复杂模式匹配问题。(4)根据上述研究,设计并实现了一个面向领域的Deep Web信息集成系统。本文还对文中提出的方法和技术进行了实验设计,通过对实验结果的分析进一步验证了本文提出的技术方法是行之有效的。
其他文献
多媒体技术和网络技术的飞速发展使得数字音频的复制、修改和传播变得极其方便,但同时音频的真实性也受到了极大的威胁。为了得到安全的多媒体应用,对音频内容的真实性和完整
在计算机网络的发展过程中曾经出现了多种工业控制网络,随着这些网络的广泛应用,将异构网络互连起来成为不可逆转的趋势。由于工业网络对传输时延的要求比较严格,因此,研究异
触摸技术的应用越来越广泛,一个好的检测方法也越来越重要。本篇论文提出采用金属手指来代替传统的检测方法,不仅能发现没有手指接触触摸板或触摸屏时的性能,同时也能检测出当手指在触摸板或触摸屏上移动时的性能。由此可见,如何控制金属手指的移动是系统的关键部分。由于直流无刷电机不采用机械的换向装置,控制方便,可以采用闭环系统来控制电机的转速以及位置,比伺服电机价格便宜,所以系统采用直流无刷电机来控制金属手指运
工作流是一类能够完全自动或半自动执行的过程,根据一系列过程规则、文档、信息或者任务在不同的执行者之问进行传递与执行。工作流管理的目的是为了通过实现业务流程的自动
在计算机图形学的研究领域,三维网格模型分割技术和检索技术已经成为近年研究的热门课题。随着三维扫描技术的发展和三维造型技术的成熟,三维网格模型被越来越多的应用于3D数
无线Ad Hoc网络是一种不需要任何基础设施支撑、无中心基站的自组织网络,它也是一种可以随时随地构建通信系统的自治网络。由于无线网络资源(如频谱和功率等)是有限的,用户共
随着软件产业的飞速发展,企业资源计划、客户关系管理、供应链管理这类企业应用软件在企业中的应用越来越广泛。同时,软件技术的不断变化、软件规模的扩大和企业业务复杂度的
近年来,三维网格模型分割研究已经取得了大量成果,但尚未出现通用的网格分割算法或基本理论,现有的网格分割算法均为面向具体的应用需求、针对特定的三维网格模型提出的,普适
信息技术的飞速发展超乎了我们的想象,并且已经广泛应用到生活中的各个领域,现在我们的日常生活已经离不开计算机,甚至是出现了很多新生的科技产品,他们与计算机的工作方式极
网络移动性管理的研究和应用近年来得到了广泛的关注,涉及到的关键技术包括了移动性管理,位置管理,切换管理,路由优化,安全机制和流量分配等。在移动IPv6基础上提出的NEMO协