基于Web使用挖掘自适应网站的研究

来源 :华东交通大学 | 被引量 : 0次 | 上传用户:mir80
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
互联网已经迅速发展成为我们生活、工作和学习中一个不可或缺的重要组成部分。 如何从这个巨大信息海洋中寻找所需的信息资源或定制自己的服务成为人们迫切关心的问题。作为互联网服务的提供方,Web 网站的重要性也日益提高,如何合理设计网站布局以方便用户浏览成为Web 网站优化工作的重点。与此同时,电子商务也在以令人难以置信的速度蓬勃发展着,在这样一个全新的商业环境中,怎样吸引新的客户并通过自身提供的资源和服务进一步留住这些客户,成为众多开展电子商务企业所面临的一个难题。因此,采用Web 挖掘自动地提取出有价值的知识,构建自适应网站,提高WWW的效率,将具有十分重要的现实意义和广阔的应用前景。 本文研究将集中在基于图结构的用户访问模式挖掘及其在自适应Web 网站的应用上,将数据挖掘技术、数据库技术与Web 技术相结合,在分析网站逻辑结构的基础上,通过对用户访问模式的数据挖掘,对己存在的Web 网站的结构及网站内的页面进行调整和改善,使其具有自适应能力和优化能力,使各类信息和服务以更有效的方式提供给用户。 首先,定义了自适应网站,区分了可适应网站和自适应网站。其次,讨论了Web数据挖掘技术,Web 数据挖掘的分类,分析进行Web 日志挖掘的数据基础及在进行挖掘前需要的数据准备工作,包括数据清洗、用户识别、会话识别、路径完善和事务识别等数据预处理过程。再次,提出一种基于Web 拓扑结构(图结构)挖掘用户访问模式的方法,区别于常用关联规则算法,在候选集的连接和剪除过程中减少了候选集的数量,提高了发现模式的精确性和效率。利用Web 日志挖掘获得的规则和模式对己存在的Web网站的结构及网站内的页面进行调整和改善。包括链接位置的变动,增加页面的链接等,运用页面关联的结果可方便地向浏览模式相似的用户组推荐其感兴趣的主题相似的页面,从而实现网站组织结构的优化。对系统进行了实际运行测试,得到了可行性验证。 论文的结尾,对所做的工作进行了归纳与总结,探讨了将来进一步的研究方向。
其他文献
随着社会的发展和当前人们要求的不断提高,人们已不再满足在一个固定位置接入互联网,希望随时随地接入互联网中而不会中断现有的连接。移动IP技术正是适应这些需求而产生的。在
随着计算机网络技术应用的日益广泛以及一些特殊领域对网络系统安全的需求,用于隐藏通信双方身份和通信关系的匿名通信技术得到了快速发展,成为了许多在线网络应用的基本要求
计算机自动组卷系统作为实现考试标准化、公平化、合理化的一个重要手段,其研究、运用已经越来越受到人们的关注。本文在分析国内外大量文献的基础上,对智能自动组卷问题及常用
随着计算机技术的不断发展,高性价比计算机的出现和高速网络的迅速发展,并行计算机开始出现并投入使用,因此并行处理技术也开始引入各个研究领域,为解决一系列问题提供了一种
随着多媒体技术的不断进步,网络传输多媒体资源也越来越多,网络的传输增大了多媒体资源被恶意篡改的几率。数字图像以生动形象的表现形式在人们日常生活中的使用越来越频繁,
伴随工业机器视觉检测技术不断发展,各种视觉检测技术也相继成为工业生产中检测环节的首选技术,进而导致对工业磁片检测的要求愈加严苛。目前普遍采用的检测方案为效率较高的
人的面部表情含有丰富的人体行为信息。在人与人的交往中,面部表情是除了声音之外的重要的通信方式。作为信息的载体,表情能够传达很多语音所不能传达的信息。面部表情识别系
身份管理是当前企业应用系统的突出问题,也是目前分布式资源系统建设的研究热点。虽然身份管理技术和标准日趋完善,许多组织和企业也提出了很多身份管理解决方案,但是在具体的应
随着我国经济的增长,对能源的需求不断增加,煤炭作为我国的重要能源之一,需求量也随之会快速增加。但是,煤矿生产带来的安全问题却成为业界一直不可回避的问题之一。尤其矿难
我国拥有世界上最丰富的制造业资源,但我国的制造业所使用的粗犷的制造方式却极大的限制了制造业资源的利用率。但“物联”严重不足的情况导致了大量制造企业资源闲置,如何汇