【摘 要】
:
Internet快速地发展,见证了网络信息正在以前所未有的速率增长,其中很大一部分信息被“深藏”于各种各样的网络在线数据库中,用户只能通过向接口提交查询来获取信息,这类信息
论文部分内容阅读
Internet快速地发展,见证了网络信息正在以前所未有的速率增长,其中很大一部分信息被“深藏”于各种各样的网络在线数据库中,用户只能通过向接口提交查询来获取信息,这类信息被称为Deep Web。Deep Web是一个新兴的研究领域,得到了越来越多的关注。本文首先对Deep Web模式获取技术进行深入地认识和研究,依据模式知识来实现Deep Web数据抽取,提出相应的算法和模型。最后提出了一个面向Deep Web对象的垂直搜索引擎系统的设计。本文主要研究的工作包括:(1)本文先对Deep Web相关知识和国内外研究状况进行介绍,并提出了本文研究的基本框架和重点难点问题。(2)分析基于视觉特征的网页分割技术,在此基础上提出Deep Web查询接口模式和结果页面模式抽取的方法。(3)进行Deep Web模式匹配的研究,提出混合模式匹配技术和算法,构造并生成Deep Web主题领域全局模式。(4)研究Deep Web数据抽取方法,提出基于模式的Wrapper的生成技术,并对维持该Wrapper技术做简单介绍。(5)介绍了垂直搜索引擎技术,并根据上述研究的技术设计了一个面向Deep Web对象的垂直搜索引擎系统。本文还对文中提出的方法和技术进行了实验设计,通过对实验结果的分析进一步证明本文提出的技术方法是行之有效的。
其他文献
虚拟现实技术是一门人与信息科学相结合的高新技术,它由计算机生成的人机交互的三维空间环境构成,利用虚拟现实技术,可以使参与者足不出户就感受到身外的世界。本项研究以“
模型驱动架构(MDA)提供了一种使用模型来指导系统的设计、开发和维护的方法,它特别关注与技术是否相关的概念间的分离,以提高软件的可重用性和可移植性。对象约束语言(OCL)被定
随着计算机应用的日益普及和信息网络技术的飞速发展,网络安全问题越来越显示出其重要性。作为防火墙的有益补充,入侵检测技术引起了广泛的关注,但是目前的入侵检测系统大多是基
本文研究背景是基于Direct3D的虚拟实验教学平台,主要从设计和实现两方面讨论了本平台研发实现过程中使用的主要技术。本文首先简单的介绍了三维图形技术的一些基础知识。接
Ad Hoc网络是一种多跳、自组织、分布式的无线网络。整个网络没有固定的基础设施,每个节点都是移动和动态变化的,可以随时随地快速进行部署。然而,无线信道固有的特点及节点移动
随着世界经济整体发展,经济全球化,国际贸易量的增加以及人类环保观念的增强,新船的诞生和旧船的更新速度迅速加快,这些因素将推动造船量的增加,全世界的造船业在21世纪将有很大发
随着信息隐藏技术的快速发展,人们可以方便地获取和使用多种隐写工具,而这些工具的滥用却严重威胁着网络信息安全,所以对反隐写技术的研究即隐写分析将会是一项紧迫的任务。
近年来,基于位置服务LBS的应用越来越广泛,这主要得益于智能手机上自带功能强大的位置传感器的普及。LBS的典型应用有:移动社交网络中查找附近好友,以及寻找离自己最近的加油
随着计算机技术的不断发展,软件开发人员已经可以使用各种高级语言(如C++和Java)来开发各种功能复杂的应用程序,但仍不能完全满足使用者的需求。脚本语言与高级语言具有很大的
计算机软件业迅猛发展,针对软件的盗版与破解也随之泛滥起来。因此,如何对软件版权以及软件程序核心内容进行保护,已经成为软件安全领域中的一些棘手问题。本文以实现对计算