【摘 要】
:
随着Internet的普及和飞速发展,万维网累积了大量的信息资源。它作为一个巨大的资源库和知识库,与人们的生活联系越来越紧密。通过万维网看新闻、写博客、查找资料等等,已经
论文部分内容阅读
随着Internet的普及和飞速发展,万维网累积了大量的信息资源。它作为一个巨大的资源库和知识库,与人们的生活联系越来越紧密。通过万维网看新闻、写博客、查找资料等等,已经成为日常生活不可或缺的一部分。但是,随着时间的推移,万维网也在默默地发生着变化,其体积在不断的增大,其中的内容也在不断消失、更换和增多。在万维网不断发展壮大的过程中,Internet有一部分内容在逐渐地消失,像一些过期的网页、个人博客等等。这种消失分为两种情况,一是Web页面所在的服务器不再提供服务,二是这些内容被新的内容替换了,但这两种消失都可能是永久性的。针对这种情况,近年来很多机构开始研究和建立各自Web档案系统,并不断地扩展其应用,使其成为一个不断增长的知识库,一个Web的历史博物馆。网页档案系统按照时间顺序将Internet上存在的大量网页收集起来,进行必要的整理,以供将来的研究和使用。其意义在于它能够将随着时间大量流逝的网页保留下来,为针对Internet的研究提供一个比较全面的数据源,并可以以近似原貌的形式将其显示出来,通过更深入的研究还可以在其基础上实现进一步的应用。基于此,本文提出了一种面向Web档案的页面分块方法,初步建立了一个基于页面分块的Web档案原型系统,该系统以页面块为单位探测Web页面的变化,并能够实现块级别的增量存储,为历史页面的查询和研究提供数据源。与传统的基于整个页面的Web档案构建方法相比,本文工作的特点是基于页面分块技术,使版本比较、存储均以块为单位,减少了版本比较和存储的开销。实验表明,本文提出的基于页面块的Web档案系统构建方法是可行和有效的。
其他文献
随着3G网络的全面铺开,移动视频电话的瓶颈渐渐得以解决。3G-324M协议是3GPP组织规定的3G网络上的多媒体通信协议,也是目前唯一的3G手机可视电话的国际标准,随着3G网络的全面
随着信息科学和网络技术的发展,信息安全已经变得越来越重要。密码学是最有效的加强信息安全的方法之一。然而,传统密码学中的密钥管理存在一些缺陷,比如,如果密钥太短或者太
电信行业是信息化的基础产业,是关系到各行各业通讯、联络的重要行业,随着电信行业的发展,其业务管理的信息量不断增多。目前在各项业务的信息管理方面由于沟通不利而导致的
随着信息技术和网络技术的飞速发展,不断出现庞大的、不同内容的图像信息库,互联网上的图像资源更是成倍增长;石材工业的发展同样使得石材图像信息库越来越庞大。为了高效、
伴随着网络技术和计算机技术的飞速发展,全球的数字化浪潮带来了数字信息的爆炸性增长。企业和政府重要部门在信息化的过程中积累了大量的数据,然而作为主要存储设备的磁盘目
目前,多数云工作流调度算法只考虑用户的单个需求,通常采用启发式算法解决单个目标的优化问题。从用户角度,运行时间和运行成本是两个最重要的性能指标,他们希望提交的应用在
网络建模是指建立正式的网络描述与模拟,可实现对未来网络行为的预测。网络预测对网络流量分布、规律的掌握,可以预测网络的发展状况,有助于网络管理和决策。目前网络行为的
集成了传感器技术、微机电系统技术、无线通信技术和分布式信息处理技术的无线传感器网络(wireless sensor networks, WSN)是一种全新的计算模式,是继Internet之后将对21世纪
近几年,道路交通伤害已经成为世界上人员伤亡的一项主要原因。交通事故不仅给人们带来了巨大的伤害,而且也对经济、环境产生了重大影响。驾驶员的疲劳驾驶已经成为交通事故发
近些年来,网络模拟得到了广泛的研究并取得了一定的进展,并且已成为研究网络的重要手段。随着计算机网络的快速发展,所需研究的网络规模越来越大,而大规模网络模拟所需的大量