数据挖掘技术在Web预取中的应用研究

来源 :西安交通大学 | 被引量 : 0次 | 上传用户:owennb1
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
WWW是一个开放的全球性的资源,它包含了海量的跟人类生活密切相关的数据.随着WWW上信息的爆炸性的增长,在如此大量的数据中发现有用的信息变得困难.而数据挖掘技术是从大量的数据中提取出隐藏在数据之后的有用的信息.因此,采用数据挖掘技术从WWW上提取出有价值的知识,提高WWW的服务效率,具有十分重要的现实意义和广泛的应用前景.该文致力于研究利用数据挖掘技术实现Web预取,以期降低用户的访问延迟,提高网络浏览速度.该文在概述了数据挖掘、关联规则发现、Web挖掘的基础上,提出了一种利用关联规则解决网络拥塞问题的方法:通过对服务器上的日志进行挖掘,得到用户访问序列的关联规则,根据这些规则和用户目前访问网页,把用户随后最有可能访问的网页预先发送给用户,来提高用户浏览速度.文中结合实例详细论述了该方法的实现方案、算法、运行的环境,提出了多种预取策略,并对预取算法进行了实验,对各种预取策略进行了分析、比较和评价.本文还研究了从客户端实现Web预取的方法:根据用户本地Cache中保存的大量用户访问网站的历史数据和当前访问的数据,利用数据挖掘技术来预测用户将来的可能行为,从而为用户预取一些Web页面.文中对徐宝文等提出的用户兴趣关联规则挖掘算法和预测算法<[22]>进行了补充改进,提高了预测的准确度.
其他文献
计算机仿真器目前正在得到广泛的应用.通过对计算机系统硬件的仿真,它能够辅助对计算机体系结构的研究,支持新型硬件和系统软件的并行开发,替换老式计算机系统中的硬件而保证
随着网络规模的急剧膨胀和应用类型的持续丰富,作为数据中心网络核心的交换机,承载功能不断扩展,使得交换机数据转发单元已经变得臃肿不堪。交换机厂商出于自身技术和市场占
在认知无线电传感器网络中,由于多数感知节点采用电池供电,因此,能量和频谱资源都是该网络的短缺资源,需要高效利用。认知无线电传感器网络通过频谱感知,保障授权用户的通信
WWW的出现导致网站上的文本数量成指数级增长,因此如何自动处理这些海量联机文本成为目前重要的研究课题.自动文本分类是文本信息处理的一个重要环节.在我们的研究中,完整地
近几年,商业化的入侵检测系统得到很快的发展,入侵检测系统已经成为大型网络的标准装备,然而如何定量评估这些系统的各项指标一直没有一个统一的标准,这是因为在测试中我们必须解
学位
该文对网络缓存技术进行了系统地分析,归纳总结了网络缓存技术的概念、特点、分类,并且阐述了缓存技术的应用和发展方向.在此基础上,提出了一种基于Cache Digest的分布式缓存
随着网络技术和多媒体技术的不断发展,网络视频会议系统被广泛应用.但是目前的视频会议系统存在着二个主要的问题和不足.一个是系统支持的同时在线的用户数量有限,即缺乏支持
学位
云计算通过虚拟化等技术将软硬件资源整合后构建为资源池,并以服务的形式按需提供给用户,具有高可扩展性、高可靠性和弹性服务的特点,提高了资源利用效率,成为信息技术领域研