【摘 要】
:
21世纪是以网络为基础、高新技术为核心的知识经济社会,网络对我们的生活越来越重要,越来越多的人从网上搜索资料,如今用户对搜索引擎的依赖性越来越强,对搜索结果“专、精、
论文部分内容阅读
21世纪是以网络为基础、高新技术为核心的知识经济社会,网络对我们的生活越来越重要,越来越多的人从网上搜索资料,如今用户对搜索引擎的依赖性越来越强,对搜索结果“专、精、深”要求也越来越高,传统的网页搜索引擎已经满足不了广大用户的需求。Deep Web与普通网页相比,信息量更大、主题更专一、数据结构化信息更好、信息质量更高,能有效地对Deep Web中的资源进行搜索,为用户提供更有价值的信息。Deep Web搜索需要突破传统搜索技术上的局限性,从网络上自动识别可搜索的数据库,通过搜索接口提交搜索请求并对返回的查询结果进行分析,取出需要的数据处理后再以某种形式返回给用户。本着搜索更深入,信息更专业的宗旨,文本论述了深度网关键研究工作,实现了基于云计算的深度网垂直搜索系统。将互联网海量无序化信息结构化,为用户提供专著、具体、深入的信息检索服务,采用简单模式、文本向量特征等多种分类方式实现页面的准确归类。并通过实验证明,该方法具有网页抓取的高效性以及页面分类的准确性。另外,本文根据不同类别的URL提供不同的更新算法,合理地实现了数据的增量更新。实验数据表明这种增量更新算法是可行的,并且随着网页的动态更新,系统中各参数会根据每次自动更新的情况实现自动调整,使更新频率、更新范围都实现了自动调节。
其他文献
科学技术的进步推动着人类进入了一个崭新的信息时代,信息和信息技术改变了人类的生活和工作方式,已经成为当今最具活力的生产要素和最重要的战略资源。现今,各种各样的信息充斥
随着计算机网络的飞速发展,多媒体数据越来越多地出现在互联网上,多媒体信息的无序使得用户在其搜索和管理上都很不方便。快速便捷地进行多媒体信息的检索、查询和浏览,成了人们
面对海量的Web服务,服务请求者要想快速高效地得到理想的服务,必须要有一种高效的Web服务匹配和Web服务选择方法,因此对Web服务匹配和Web服务选择方法的研究具有重要意义,本
随着互联网与计算机技术的飞速发展,全球各国都在进入一个高速发展的信息化阶段。海量的信息在给人类的生活提供便利的同时,也带来了信息灾难。尤其是最近几年移动互联网与智
微粒群算法是一种典型的群智能算法,其基本生物学背景是模拟鸟群觅食、鱼群游动等动物行为。然而,从决策的观点来看,微粒的进化方程可以视为个体的决策过程。为此,本文将群体
近年来随着多媒体数据成数量级的增长,对于多媒体的分析和分类变得越来越迫切。当人们阅读和理解视/音频内容时,作为多媒体数据中重要部分的音频,为人们的感知提供了重要的线索
摘要:随着信息技术的飞速发展,需要处理的数据量呈级数增长,可视化技术在数据分析和挖掘过程中发挥着越来越重要的作用。与此同时,可视化技术种类也日益增多,且它的应用范围也
随着宽带互联网络的推广与普及,基于宽带网络技术的宽带无线业务得到了迅速的增长。为了满足人们对高速数据业务及多媒体业务的应用需求,有必要开发具有更强大的多媒体业务负载
随着信息技术的发展和城市经济社会的发展,城市地下管道网络的规模也逐渐扩大,排水管线、给水管线、燃气管线、电力管线等,众多管线纵横交错、遍布整个城市,构成一张密织的网