基于用户行为模式的Web日志挖掘模型的研究与实现

来源 :南京邮电大学 | 被引量 : 0次 | 上传用户:happytime3
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着因特网的高速发展,人们的生活已经已经与其密不可分,因特网已经成为人们获取信息重要的手段。目前,企业网站,购物网站,社交网站浏览量越来越多,用户在网站遗留的记录也越来越多,因此网络服务器端存储了海量的用户数据。面对如此宝贵的资源,如何分析蕴藏在其中的信息和知识,挖掘用户行为并加以有效利用,是当前互联网企业的最主要的需求之一。通过对Web日志和用户行为的分析,可以挖掘出隐藏在其之后的用户访问规律,从而解决上述问题。本文对已有的Web数据挖掘模型及算法进行分析总结,提出一种基于时间分片的用户偏爱浏览路径算法。该算法依据用户访问网站时间,将用户访问的日志记录转换成为对应的月份、星期、时刻矩阵,并把这月份、星期、时刻矩阵相加,根据调节三个矩阵的权重得到一个最终的平均矩阵,把这个平均矩阵导入到现有的偏爱浏览路径算法之中,得到用户偏爱访问路径。实验数据的测试仿真结果表明,本文提出的算法能够根据不同的矩阵权重参数获得不同的偏爱访问路径结果,在结果中剔除与当前时间分片不符合的访问路径,提高了精确率。最后,本文依据Web日志挖掘的过程模型和西祠胡同社区网站的需求分析,构建了基于时间分片的用户偏爱浏览路径算法的数据挖掘原型系统。测试结果表明,该系统能够为用户提供较高精确率的浏览路径。
其他文献
冷冻保护剂和添加液的正确选择是保证冷冻血小板质量的重要因素。冷冻血小板体内即刻止血功能明显优于液体保存血小板。为更好地保证冷冻血小板的质量,了解二甲亚砜(DMSO)在冷
加多宝和王老吉的商标之争虽然结束,但是他们在市场上的竞争才刚刚开始。从加多宝在凉茶的优势地位我们看出,虽然广药集团赢得了商标,却失了渠道。本文通过对加多宝和广药王
随着虚拟现实技术和计算机图形学的发展,网络三维技术Web3D的研究越来越受到人们的关注。X3D是互联网3D图形国际通用软件标准,被定义为可交互操作、可扩展、跨平台的网络3D内
国内越来越多的高层、超高层建筑采用了钢板混凝土剪力墙结构。从钢板墙组成、地脚螺栓的埋设、钢板的吊装和稳定、钢板的焊接和螺栓连接工艺等方面阐述了钢板剪力墙内劲性钢
本文以高中班主任为研究对象,采用开放式问卷、行为事件访谈(BEI)和问卷测验等研究方法,构建高中班主任胜任特征模型,编制了《高中班主任胜任特征自评问卷》,考察了高中班主任胜任
农田温室气体排放与农田碳汇是现代农业生态系统过程研究的两个核心,稻麦两熟制是长江中下游地区主体的农田种植方式,因此探索稻麦两熟制下不同土壤管理方式对农田温室气体排
质量是印刷品的生命,特别是在信息时代,各类电子产品及网络出版物对印刷业的影响,使质量控制成为印刷业降低成本、提高竞争力的重要措施。印刷质量控制的最终目标,一是提高产品的
民事诉讼中原审原告是否可以在二审程序中撤回起诉即为本文的论题。撤回起诉权作为民事原告享有的一种处分权,其始存于原告向法院起诉时,然何时终止,我国现行法律未明确规定,由此
近年来,电子商务被商家视为一种获取竞争优势和拓展市场能力的重要手段。本文以电子商务运作的理论研究和实证应用为基础,将电子商务运作和企业网络化连接的模式归纳为主要两
新一轮土地流转与当年的联产承包责任制一样意义深远,是一件利国利民的大事。但在推进土地流转的进程中,存在一些亟待解决的问题:一些农地没有进行勾图定位,四至边界不清,权