匿名用户浏览路径挖掘研究与实现

来源 :南京理工大学 | 被引量 : 0次 | 上传用户:liu_tangdanhua
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着网络规模和网络用户的快速增长,理解用户对网络的浏览模式变得越来越重要,因为其对于网络结构的优化、站点的重构,个性化服务和推荐的产生等具有重要的意义。 在实际情况下,用户对网络的浏览大都以匿名方式进行的,网站对他们所知甚少,因此,没有明确的用户信息情况下的网络匿名用户浏览路径挖掘具有很强的实际应用价值。 本文在对匿名用户环境下的Web数据挖掘进行了深入分析研究,设计实现了一个基于Web日志记录的匿名用户浏览路径挖掘系统。该系统通过对Web日志的数据挖掘处理,完成了相应的网络匿名用户浏览路径的获取和分析研究。 论文对系统进行整体规划设计,给出了一种改进的频繁路径挖掘算法(FBP)以完成匿名用户频繁路径的挖掘;通过引入浏览路径兴趣度定义,在匿名用户Web访问矩阵上实现了网络匿名用户兴趣路径挖掘;结合用户浏览路径相似度,采用聚类方法挖掘典型匿名用户路径。 最后对系统挖掘的结果进行了实验分析,并提出了系统进一步完善的若干设想,从而为网络结构优化、站点重构提供参考及个性化服务和推荐提供依据。
其他文献
随着互联网技术的飞速发展,网络正在成为人们进行信息交流和信息处理的有效平台,各种数字化的信息每天以极高的速度增长,网络上积累了海量的数据。面对如此巨大的信息量,如何发现
随着互联网的高速发展,云计算集群系统越来越大,处理数据的规模越来越大,这样就需要一个高效的分布式处理系统进行数据挖掘、计算等任务。MapReduce是Hadoop下的计算框架,也是云
学位
为了实际应用的需要,快速鲁棒的人脸检测和识别研究在模式识别和机器学习领域里引起了广泛的重视.本文提出了一种基于统计学习理论的判决特征选择方法和快速分类方法,仔细研
跨域认证,特别是不同类型之间的跨域认证是认证研究的重要课题。主动网的授权用户拥有比传统网络授权用户更多的访问能力,对他们的认证关系到主动网的安全,在主动网上进行跨
随着Internet的飞速发展,从IPv4向IPv6过渡是必然的趋势,在相当长的时间内,IPv4将与IPv6共存。IPv6为互联网发展带来的巨大的挑战和机遇,因为IPv6协议不是完全向下兼容的,必然导致
随着水利工程及岩石工程的建设和发展,岩石内部裂隙的各种科学研究越来越重要。而利用计算机进行岩石内部裂隙的三维形态的重建可以直观有效地展示岩石内部结构将帮助其他科
集控式机器人足球比赛系统分为视觉子系统、决策子系统、通讯子系统和足球机器人小车子系统四个部分,其中小车子系统的性能直接决定着足球机器人在赛场上的表现。本文通过分析
数据库系统担负着对数据信息访问控制和存储的任务,数据库不安全的主要原因之一是原始数据以明文可读形式存放在数据库中,如果对数据库中的数据进行加密处理,那么上述问题可以得
长久以来,人们就想制造出一种具有智能的机器,它能通过自然语言与人类交流并服务于人类。计算机的出现和迅速发展为这个梦想的实现带来了希望。因此,人们迫切地需要计算机具有理