Web日志挖掘在网站优化中的研究与应用

来源 :大连海事大学 | 被引量 : 3次 | 上传用户:greattomliu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
Web日志挖掘是Web挖掘中重要的研究课题之一。Web日志挖掘的研究对象是Web日志数据。从服务器的观点分析,挖掘的对象是提供服务的网站的信息,挖掘结果可以帮助改善网站的设计。从用户的点击序列分析,可以发现一个用户的使用信息,可帮助实现网页的预存取和缓存。本文所要研究的Web日志挖掘在网站优化中的应用就是对Web使用日志这些半结构化的数据进行预处理后,根据Mark Sweiger和Mark R.Madsen提出的点击流数据仓库模型,并结合就业网站的实际数据,创建了适合实例网站的点击流数据仓库模型,然后运用SQL 2000 Analysis Service中的决策树模型进行数据挖掘,最后对数据挖掘结果进行数据分析,给网站的管理者提供网站结构优化的建议。本文主要在如下的方面做了主要的工作:首先为数据预处理的数据导入、用户识别和会话识别部分提供了详细的算法,WEB日志数据通过这些算法进行预处理后,为数据仓库的建立提供了可靠的准备数据。其次在点击流数据仓库模式建立的问题上,根据前人提供的标准点击流仓库模型,提出了适合实例网站的数据仓库逻辑模型,并在此逻辑模型的基础上,建立相应的物理模型。最后将上述的数据预处理算法和数据仓库模型应用在就业网近两个月的Web访问日志中,然后运用决策树模型分析数据源的各个维,并将分析结果在网站结构的调整中进行应用。
其他文献
1加强毕业设计所需文献资料管理是做好服务工作的基础1.1合理安排文献布局,设置毕业设计资料专柜(架)我馆情报资料室的藏书以科技文献资料和科技期刊为主,共有科技资料12181种,24587册。近两年常
随着Internet在我国的发展,不少大学图书馆的局域网、校园网连入CERNET或Chinanet与In-ternet互连。Internet上有大量的各种无偿信息,包括图书、期刊、报纸、图书馆目录、录相资料等多种信息资源。它检索方便,获得信息速
中英图书馆学情报学教育都曾有过辉煌,但近年来由于社会经济环境,人才需求变化,均出现了“不景气”、“危机”的局面。穷则思变,两国专家均认识到要适应社会,必须进行教育改革。本
患者,女,12岁。以“右大腿疼痛、肿物1个月”于2007年11月16日入院。入院前1个月剧烈活动后右大腿疼痛并发现右大腿中段包块,无明显夜间痛,无发热。入院时查体:轻度跛行,右大
网络时代的到临,微博社交网络成为了网络舆论传播的主要载体。虚拟社交网络信息交流的便利性以及频繁性引发了众多学者的关注,特别是关于识别在更大程度上影响微博网络结构与
中国教育家陶行知先生倡导的“教学做合一”思想是创造性教育教学的核心,在物理教学实践中,以“做”为中心,“教、学、做”融为一体,引领物理创新教育.文章从“任务教学、示
随着信息技术的发展,经济全球化进程的加快,连锁商业企业纷纷崛起,大量分布的连锁分店、配送中心与总店间通过网络互连,形成了分布型的商业共享数据环境。这种环境下,商业数
本文指出我国包装设计教育存在的主要问题,概括起来说是“重技术、轻创造、缺人文”,并提出可从优化课程结构、提高创造力、加强人文修养、建立完善的教学实践手段以及加强教
互动式教学模式作为近年来新兴的一种教学模式,其教学思想符合自主合作学习和以学生为主体的教学理念,高中英语教师应重视互动式教学对于高中英语教学的重要性,借助这一教学
“留白式”导语是指统编教材小学《道德与法治》在主持人的话中以省略号的形式表示部分内容,起到“留白”的作用.在课堂教学中,教师要充分把握“留白式”导语的教学价值,将教