论文部分内容阅读
随着Internet的迅速发展和普及,电子商务的发展越来越多地引起研究者们的关注,期望能够在这种新型的商务模式下,充分利用它的优点,获得更多的经济效益。Web已经成为企业开展电子商务的基础。将数据挖掘的思想和方法应用到电子商务中,帮助电子商务的经营者从海量的信息中得到真正有价值的知识,以指导他们的决策。Web数据挖掘就是在这样的背景下与电子商务结合在一起的。Web数据挖掘是数据挖掘领域的一个新的研究方向。 Web数据挖掘是针对包括Web页面内容、页面之间的结构、用户访问信息、电子商务信息在内的各种Web数据。Web访问挖掘是通过分析Web访问日志来发现用户访问Web页面的模式。通过分析和研究Web访问日志可以识别出潜在的电子商务用户,提高对用户的服务质量和Web服务器的效率。 本论文针对Web访问信息挖掘进行了深入细致的研究,Web访问信息挖掘通过对用户访问信息进行有效的数据挖掘,可以得到有关用户访问行为的知识,这些知识可以发现电子商务中用户的访问模式和在电子商务中针对用户实现个性化页面推荐。同时本文设计了一个针对电子商务网站Web访问信息挖掘的实现方案。 本论文的主要工作表现在以下几个方面: 1.给出了国内外的研究现状和论文本身的意义,以及相关的理论支持。 2.提出了一种对Web访问日志进行预处理的方法。通过预处理Web访问日志,删除对于Web挖掘没有价值的数据,识别出用户会话事务,形成用户会话的数据库。 3.运用最大向前引用方法对用户会话进行分割,得到用户的事务数据库。 4.将关联规则挖掘技术运用到电子商务中用产访问模式发现中。传统的关联规则挖掘技术并不适合Web中的用户访问模式的挖掘,所以必须改进关联规则的挖掘算法,在论文中提出了一种新的频繁路径的挖掘算法,用该算法发现在电子商务网站中用户的访问模式。这些被发现的模式可以帮助电子商务的经营者改进网站的设计。 5.提出了协作聚类的思想和实现的算法。通过协作聚类可以对电子商务的用户进行分类,针对不同类型的用户进行不同的页面推荐,实现了电子商务的个性化服务。 最后,本文对作者所完成的工作进行了归纳和总结,并讨论了将来进一步的研究方向。