论文部分内容阅读
Web技术的发展使得商务网站风起云涌,电子商务已经成为商业的新模式。建构一个电子商务网站并不难,难的是如何让电子商务网站获得效益,利用Web挖掘技术可以有效地解决这个问题。
Web日志挖掘通过分析用户与Web服务器交互时产生的日志数据,运用数据挖掘技术发现隐含的规律性知识,得到用户的访问模式和用户浏览兴趣,从而为用户的个性化服务提供依据、为电子商务站点管理员提供各种利于Web站点改进或可以带来经济效益的信息。
本文针对数据挖掘、Web数据挖掘以及Web日志挖掘在电子商务中的应用进行了深刻的剖析,对基于电子商务的Web日志挖掘的过程、所采用技术以及挖掘的应用进行了全面的论述,为进行Web日志挖掘提供了理论基础。设计了一个数据挖掘工具WLMiner,该工具以Web服务器日志作为数据源,并从数据收集、数据预处理、数据模式挖掘和模式分析四个阶段阐述WLMiner系统的整体结构、实现方法和关键技术一一在数据预处理模块,引入了基于日志引用页的用户识别算法、启发式会话识别算法、结合站点Topo结构路径补全算法和MFP算法分别进行用户识别、会话识别、路径补全和事务分割,并给出部分JAVA实现代码;在模式挖掘模块,引入并研究了路径遍历模式挖掘算法和用户浏览模式挖掘算法,并把路径遍历模式挖掘算法运用到WLMiner中来进行模式挖掘。最后给出了Web日志挖掘系统WLMiner在模拟商务网站中的实验结果,并把实验结果反馈到商务站点以改进站点设计以及进行其他商务活动。
对于电子商务网站而言,以上提出的理论与算法以及Web日志挖掘系统WLMiner都具有较重要的意义和研究价值。