论文部分内容阅读
随着网络规模和网络用户的快速增长,理解用户对网络的浏览模式变得越来越重要,因为其对于网络结构的优化、站点的重构,个性化服务和推荐的产生等具有重要的意义。 在实际情况下,用户对网络的浏览大都以匿名方式进行的,网站对他们所知甚少,因此,没有明确的用户信息情况下的网络匿名用户浏览路径挖掘具有很强的实际应用价值。 本文在对匿名用户环境下的Web数据挖掘进行了深入分析研究,设计实现了一个基于Web日志记录的匿名用户浏览路径挖掘系统。该系统通过对Web日志的数据挖掘处理,完成了相应的网络匿名用户浏览路径的获取和分析研究。 论文对系统进行整体规划设计,给出了一种改进的频繁路径挖掘算法(FBP)以完成匿名用户频繁路径的挖掘;通过引入浏览路径兴趣度定义,在匿名用户Web访问矩阵上实现了网络匿名用户兴趣路径挖掘;结合用户浏览路径相似度,采用聚类方法挖掘典型匿名用户路径。 最后对系统挖掘的结果进行了实验分析,并提出了系统进一步完善的若干设想,从而为网络结构优化、站点重构提供参考及个性化服务和推荐提供依据。