论文部分内容阅读
将数据挖掘技术应用到Web上是一个新兴的课题,同时也具有很大的使用价值。本文作了四个层面的探讨:首先对数据挖掘技术进行了介绍和分析。其次,分析了数据挖掘中所使用的关联规则和序列模式,对关联规则和序列模式的各种挖掘算法进行了比较。第三,论述数据挖掘技术在Web上的运用,提出了web挖掘的体系结构。第四,以web数据挖掘技术为基础提出了一种向用户提供个性化信息服务的系统。该系统使用关联规则等数据挖掘技术对服务器日志进行分析,获取用户访问模式,并结合用户当前访问情况向用户提供实时的个性化信息服务。文中指出了在对服务器日志进行预处理时所面临的数据净化、用户识别、事务识别、路径补充等问题并依次提出了解决方案,最后给出了根据用户当前访问情况,从挖掘得出的频繁项目集到向用户提供的实时页面推荐集的推荐引擎的实现算法,实现了向用户实时推荐页面的个性化信息服务。