Deep Web数据集成关键技术研究

来源 :吉林大学 | 被引量 : 0次 | 上传用户:zhangdong1231
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着Web信息的激增,越来越多的信息开始由静态网页存储的方式向Web服务器维护的数据库即Deep Web转移,Deep Web包含的信息为Surface Web的400-500倍,与Surface Web相比,Deep Web包含的信息具有更高的质量,同时也是Web上增长速度最快的信息载体,对Deep Web的研究已是Web搜索领域迫在眉睫的任务。Deep Web数据集成的目的是以尽可能自动的方式实现对Web中在线数据库信息的有效利用。在面向领域的信息搜索中,相关的领域知识往往有助于改善搜索效果。本体作为最强大的网络信息语义描述工具,在信息检索中被广泛应用,因此,本文综合应用本体研究Deep Web数据集成技术,对以下四个关键技术进行了深入研究:Deep Web入口自动发现、Deep Web查询接口模式抽取、Deep Web查询接口集成和Deep Web查询接口自动填充。本文首先构建领域核心本体,在模式匹配过程中,不断完善核心本体,实现本体的自动扩展,并通过本体描述语言OWL对目标本体进行形式化描述以帮助机器理解和推理;然后,在Deep Web入口的自动发现中,应用主题爬行技术和本体技术,构造网页分类器、表单结构分类器和表单内容分类器,实现特定领域Deep Web入口表单的自动发现;在Deep Web查询接口的模式抽取中,设计了基于网页可视化特征的Deep Web查询接口模式抽取算法,实现对查询接口属性标签和查询控件的获取与分析,并根据标签和控件的逻辑关系将其重组成语义属性;在Deep Web数据库查询接口的集成中,充分利用本体提供的语义实体间的复杂关系,捕获不同查询接口间的语义特征,实现模式匹配,在语义级别上实现对查询接口真正意义上的理解,使得同一领域中多个查询接口的知识规范化、统一化,以方便于对其进行处理;在Deep Web查询接口的自动填充中,利用领域本体建立Deep Web入口表单属性与集成查询接口属性的映射关系,将用户提交的查询计划进行合法性检查后分发至各个Deep Web数据库,经查询处理后,转化为各本地查询接口相适应的查询条件,实现用户透明的集成查询接口向各个Deep Web表单的查询分发与表单重写,最后自动触发提交查询按钮。实验表明本文所提出的方法是可行的。
其他文献
复数集是实数集的延拓,复数理论已经渗透到现实世界的各个领域,为科学研究奠定了坚实基础。要想学好复数理论,并能灵活应用于实践,必须深入理解复数的相关几何意义。分析复数
创业者王兴,终将8岁的美团带到了香港证券交易所.9月20日,美团在香港挂牌上市.美团IPO发行价定在每股69港元,扣除相关发行开支后共计募集资金325.6亿港元(约合41.5亿美元).当天
随着多媒体信息处理技术和互联网的普及,一种新的信息安全技术--信息隐藏技术应运而生。几何攻击在保持图像视觉质量完好的同时,将使信息隐藏系统失去同步而导致嵌入的信息无
迪士尼是全球IP之王,根据License Global公布的全球最大150家授权商榜单显示,迪士尼2016年的授权产品全球零售额达到566亿美元,位居第一,比第二位高出近两倍。
在《气象研究与应用》创刊60年之际,广西出版协会向贵刊表示热烈的祝贺!向贵刊全体工作者表示诚挚的问候!经过几代人的不懈努力和开拓创新,《气象研究与应用》一步一步走向成熟
利用2015~2017年淮河流域汛期ECMWF(空间分辨率0.125°x0.125°)、JMA(空间分辨率0.5°x0.5°)、WRF(空间分辨率0.1°x0.1°)6h、12h、24h时间分辨
利用IPRC高分辨率区域气候模式设计了两组不同初始时刻(3月和5月)的试验,分别对6-10月热带气旋活动的特征及其大尺度环境场进行了17年的模拟试验。结果表明,两组试验对大尺度环
图像的语义识别和检索,一直以来都是计算机领域的热点问题。该问题涉及了图像处理、模式识别、人工智能以及机器视觉等众多学科领域。本文针对其中的若干关键问题做了研究,取
电子政务是国家“十一五”规划提出的信息化建设重点内容,也是当前信息技术研究与开发的重要领域。电子政务本身的特点(开放性、虚拟性、网络化)对其安全性和管理技术与方案
作为中职体育中重点教学项目,篮球教学对于提升中职学生身体素质和团队合作能力等方面起到非常重要的作用。这就应加强中职篮球教学力度,缓解中职学生日常学习压力。而且中职