基于Web会话仿真的网站结构优化研究

来源 :合肥工业大学 | 被引量 : 0次 | 上传用户:lzc5812286
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
Internet的迅猛发展和普及,使得Web信息量以惊人的速度增加,人们迫切需要能自动从Web上发现、抽取和过滤信息的工具。因此,产生了Web挖掘。Web使用挖掘是Web挖掘的重要分支,它利用数据挖掘技术对网站大量的用户访问数据及其它相关数据所组成的数据集进行分析挖掘,并从中获得有关网站访问使用情况的有价值的模式知识,以降低用户搜索信息的代价提高服务质量。Web使用挖掘是一个结合了众多学科知识的新兴领域,涌现出很多有待解决的新课题和新方向。本文围绕Web使用挖掘中的主要问题进行了以下几个方面的研究。首先,作为对Web使用挖掘进行研究的开始和基础,本文首先对Web使用挖掘中各个阶段进行了全面的分析,对挖掘技术进行了深入的探讨和分析;详细研究了Web使用挖掘的有关理论及应用空间;展望了Web使用挖掘未来的研究方向。其次,介于Web挖掘与站点结构优化的需要,本文提出了一种完全基于数学模拟方法的会话仿真器,该仿真器根据已有的网站结构,利用Markov链对用户访问行为进行建模,并应用页面PageRank值对Markov模型进行训练学习,建立仿真算法,生成可靠的仿真会话数据,为Web使用挖掘后续研究以及站点优化提供基础和指导。最后,利用关联规则指导站点优化目前人们已经有了大量的研究。但是这些优化方法主要是基于正关联规则,基于负关联的优化方法研究较少。本文提出了一种基于正负关联规则优化策略,对网站超链接重建,包括添加能显著降低转移代价的超链接和删除迷惑用户的冗余超链接两种操作,从两方面降低用户对目标信息搜索代价。关于负关联规则的研究,国内外才刚刚起步。Web使用挖掘并不是简单的直接运用现有的挖掘技术,它有着它自身的特点。本文结合Web结构,对已有的正负关联规则挖掘算法从项集的裁剪与挖掘策略两方面进行改进,提出一个快速、高效的能同时挖掘正负关联规则的算法。
其他文献
随着数据库技术的迅速发展以及数据库管理系统的广泛应用,人们积累的数据越来越多。数据挖掘技术的应运而生使得这些数据背后隐藏着的重要信息得以利用,也为更高层次的分析提供了科学依据。经过多年的发展,数据挖掘的算法已日趋成熟、稳定,且易于理解和操作,于是数据挖掘的研究重点也逐渐转向了如何应用方面。目前,数据挖掘技术在商业、金融等领域的应用已积累了很多成功经验。但在教育层面上的应用却还很少。近年来随着高校的
正义是社会伦理生活中的一个核心价值.正义的根据是什么?这是自政治哲学产生之日起就未曾停止过的追问.柏拉图和亚里士多德是古希腊政治哲学的奠基者,他们的“正义”概念深深
2008年对于各国的旅游业来说有喜有忧,苦乐不均。据最新的统计数字显示,外地到纽约的游客人数达4700万人,创了历史新高。而访问澳大利亚的外国游客人数仅为533万人,跌至20年来的最低水平。  纽约市长布隆伯格近日向媒体披露,2008年各地访问纽约的游客人数达4700万人,为纽约带来300亿美元的收入,无论游客人数还是旅游收入均创历史最高纪录。  此前统计最高的是2007年的4600万人和289亿
大仲马曾经说过:“我最得意的作品是我的儿子。”这话当然不错。比起《三个火枪手》、《基度山恩仇记》等闻名世界且经久不衰的作品,小仲马更为辉煌有力,因为他是双重作品,即能生产作品的“作品”。  可是,他忘记了,或者说是有意忘记了,这部使他格外骄傲的“作品”的“著作权”并非他一人所有,而是属于他和一个女人的共同财产。他无理、无情、残忍地剥夺了那个女人的“著作权”。这个伟大的小说家公然在全世界面前说谎。