论文部分内容阅读
【摘 要】随着Internet技术和数据库技术的飞速发展,以网络为载体、利用数字化电子方式开展的商务活动逐渐成为Web数据挖掘的一个重要应用方向。应用Web数据挖掘技术可以有效地帮助企业对商业数据库中的大量业务数据进行抽取、转换、分析和其他模型化处理,从中提取辅助商业决策的关键性数据,为企业创造出更多潜在的利润。Web数据挖掘就是在这样的背景下与电子商务结合在一起的。本文立足于web数据挖掘技术,从Web数据挖掘的技术介绍、CRM的应用和Web挖掘的作用三个角度,分析了电子商务中的web数据挖掘应用。
【关键词】web数据挖掘;电子商务;CRM
一、Web数据挖掘的技术介绍
从电子商务的角度来看,进行Web上的数据挖掘,主要就是进行客户访问信息的挖掘,得到客户端浏览行为和访问模式,从而找到有用的市场信息。在Web数据挖掘的模式发现中,一般以下几种数据挖掘技术的使用:
(一)服务器数据
客户访问服务器就会在服务器上产生相应的服务数据,这些数据通常指服务器日志文件或者Cookie日志文件,它忠实地记录了访问该Web服务器的数据流的信息。一个典型的服务器日志文件文件包含描述用户浏览网页和沿着连接所产生的点击流序列信息,相关的字段依次有:主机地址、日期/时间、请求、状态、字节、访问页和浏览器类型。
(二)数据源的收集
在对电子商务网站进行数据挖掘时,所需要的数据源主要来自于两个方面:一方面是客户的背景信息,以及客户以往的交易数据,此部分信息主要来自于客户的登记表;而另外一部分数据主要来自浏览者的点击流,这部分数据主要用于考察客户的行为表现,主要来源于服务器数据。
(三)序列模式
序列模式挖掘就是挖掘出交易集之间有时间序列关系的模式,在Web日志中发现所有满足用户规定的最小支持度的大序列模式。序列模式的发现就是在时间戳有序的事务集中,找到那些“一些项跟随另一个项”的内部事务模式。
(四)查询数据
查询数据是用户在查询自己想要的信息时在服务器端上产生的数据,它是电子商务站点在服务器上产生的一种典型数据。例如,对于在线客户也许会搜索一些产品或某些广告信息,这些查询信息就通过cookie或是登记信息连接到服务器的访问日志上。
(五)聚类分析
此技术将具有相似爱好、购物兴趣的客户分配到相同的族中,聚类产生之后,根据此类中其他客户对某商品的评价就可以得到系统对该商品的评价,聚类过程可以离线进行,聚类产生之后,性能比较好,但如果某客户处于一个聚类的边缘,则对该客户的推荐精度比较低。
(六)贝叶斯网络
贝叶斯网络技术利用训练集创建相应的模型,模型用决策树表示,节点和边表示客户信息。模型的建立可以离线进行,得到的模型非常小,对模型的使用非常快,这种方法比较适合客户的兴趣爱好变化比较慢的场合。
二、数据挖掘在客户关系管理(CRM)中的应用
(一)客户的获取
在一般的商业领域中,业务发展的主要是包括新客户的获取能力。企业的市场部门人员可以采用传统的方法来发展新客户,如开展广告活动,也可以根据了解目标客户群,将他们分类,然后进行直销。但是,随客户数量不断增长和每位客户的细节因素增多,要得出选择出相关的人口调查属性的筛选条件也会变得很困难。而数据挖掘技术可以帮助完成潜在客户的筛选工作。
(二)客户登记信息
客户登记信息也是另一个数据挖掘重要的数据源,是客户通过Web网页在屏幕上输入并提交给服务器的相关信息,比如客户的个人资料,客户要订购的商品资料、客户提出的一些问题、要求等。在面向电子商务的数据挖掘中,将客户登记信息和服务器访问日志集成,可以提高挖掘的精度和深度,得出更理想的结果。
(三)客户的细分
细分是指将一个较大的消费群体划分为一个个细分群体的动作,一个细分群的消费者彼此相似,而不同细分群的消费者被视为不同的。通过CRM的实施,将产生细分的客户群,企业根据客户的要求不断地改善产品和服务,从而使企业不断提高客户群对企业的满意程度。
三、Web挖掘的方法
(一)进行数据挖掘的时候,并不是对原始的数据进行挖掘,而是先要对数据作一些前期处理,包括合并数据,将多个文件或多个数据库中的数据进行合并处理;选择数据,提取出适合分析的数据;数据清洗、过滤,剔除一些无关记录,将文件、图形、图像及多媒体等文件转换成可便于数据挖掘的格式等。然后,根据不同挖掘的目标,可以采用不同的挖掘方法,得到有意义的数据模式。最后,通过技术手段,对得到的模式进行数据分析,得出有意义的结论。
(二)设计个性化网站:
强调信息个性化识别客户的喜好,使客户能按自己的方式来访问网站。对某些用户经常访问的地方,有针对性地提供个性化的广告条,以实现个性化市场服务。
(三)优化Web站点:
对Web站点的链接结构的优化可从两方面来考虑:
1、通过对WebLog的挖掘,发现用户访问页面的相关性,从而对密切联系的网页之间增加链接,方便用户使用。
2、利用路径分析技术判定在一个Web站点中访问最频繁的路径,可以选择把重要的商品信息放在这些页面中,改进页面和网站结构的设计,增强对客户的吸引力,提高销售量。
3、增强电子商务安全:Web的内容挖掘还包括挖掘存有客户登记信息的后台交易数据库。客户登记信息在电子商务话动中起着非常重要的作用,特别是在安全方面,或者在对客户可访问信息的限制方面。
4、搜索引擎的应用:通过对网页内容的挖掘,可以实现对网页的聚类和分类,实现网络信息的分类浏览与检索;通过用户使用的提问式历史记录分析,可以有效地进行提问扩展,提高用户的检索效果;通过运用Web挖掘技术改进关键词加权算法,可以提高网络信息的标引准确度,改善检索效果。
参考文献:
[1]董逸生.WEB挖掘研究综述.计算机科学.
[2]郝先臣,张德干,尹国成等.基于电子商务中的数据挖掘技术研究.小型微型计算机系统.
【关键词】web数据挖掘;电子商务;CRM
一、Web数据挖掘的技术介绍
从电子商务的角度来看,进行Web上的数据挖掘,主要就是进行客户访问信息的挖掘,得到客户端浏览行为和访问模式,从而找到有用的市场信息。在Web数据挖掘的模式发现中,一般以下几种数据挖掘技术的使用:
(一)服务器数据
客户访问服务器就会在服务器上产生相应的服务数据,这些数据通常指服务器日志文件或者Cookie日志文件,它忠实地记录了访问该Web服务器的数据流的信息。一个典型的服务器日志文件文件包含描述用户浏览网页和沿着连接所产生的点击流序列信息,相关的字段依次有:主机地址、日期/时间、请求、状态、字节、访问页和浏览器类型。
(二)数据源的收集
在对电子商务网站进行数据挖掘时,所需要的数据源主要来自于两个方面:一方面是客户的背景信息,以及客户以往的交易数据,此部分信息主要来自于客户的登记表;而另外一部分数据主要来自浏览者的点击流,这部分数据主要用于考察客户的行为表现,主要来源于服务器数据。
(三)序列模式
序列模式挖掘就是挖掘出交易集之间有时间序列关系的模式,在Web日志中发现所有满足用户规定的最小支持度的大序列模式。序列模式的发现就是在时间戳有序的事务集中,找到那些“一些项跟随另一个项”的内部事务模式。
(四)查询数据
查询数据是用户在查询自己想要的信息时在服务器端上产生的数据,它是电子商务站点在服务器上产生的一种典型数据。例如,对于在线客户也许会搜索一些产品或某些广告信息,这些查询信息就通过cookie或是登记信息连接到服务器的访问日志上。
(五)聚类分析
此技术将具有相似爱好、购物兴趣的客户分配到相同的族中,聚类产生之后,根据此类中其他客户对某商品的评价就可以得到系统对该商品的评价,聚类过程可以离线进行,聚类产生之后,性能比较好,但如果某客户处于一个聚类的边缘,则对该客户的推荐精度比较低。
(六)贝叶斯网络
贝叶斯网络技术利用训练集创建相应的模型,模型用决策树表示,节点和边表示客户信息。模型的建立可以离线进行,得到的模型非常小,对模型的使用非常快,这种方法比较适合客户的兴趣爱好变化比较慢的场合。
二、数据挖掘在客户关系管理(CRM)中的应用
(一)客户的获取
在一般的商业领域中,业务发展的主要是包括新客户的获取能力。企业的市场部门人员可以采用传统的方法来发展新客户,如开展广告活动,也可以根据了解目标客户群,将他们分类,然后进行直销。但是,随客户数量不断增长和每位客户的细节因素增多,要得出选择出相关的人口调查属性的筛选条件也会变得很困难。而数据挖掘技术可以帮助完成潜在客户的筛选工作。
(二)客户登记信息
客户登记信息也是另一个数据挖掘重要的数据源,是客户通过Web网页在屏幕上输入并提交给服务器的相关信息,比如客户的个人资料,客户要订购的商品资料、客户提出的一些问题、要求等。在面向电子商务的数据挖掘中,将客户登记信息和服务器访问日志集成,可以提高挖掘的精度和深度,得出更理想的结果。
(三)客户的细分
细分是指将一个较大的消费群体划分为一个个细分群体的动作,一个细分群的消费者彼此相似,而不同细分群的消费者被视为不同的。通过CRM的实施,将产生细分的客户群,企业根据客户的要求不断地改善产品和服务,从而使企业不断提高客户群对企业的满意程度。
三、Web挖掘的方法
(一)进行数据挖掘的时候,并不是对原始的数据进行挖掘,而是先要对数据作一些前期处理,包括合并数据,将多个文件或多个数据库中的数据进行合并处理;选择数据,提取出适合分析的数据;数据清洗、过滤,剔除一些无关记录,将文件、图形、图像及多媒体等文件转换成可便于数据挖掘的格式等。然后,根据不同挖掘的目标,可以采用不同的挖掘方法,得到有意义的数据模式。最后,通过技术手段,对得到的模式进行数据分析,得出有意义的结论。
(二)设计个性化网站:
强调信息个性化识别客户的喜好,使客户能按自己的方式来访问网站。对某些用户经常访问的地方,有针对性地提供个性化的广告条,以实现个性化市场服务。
(三)优化Web站点:
对Web站点的链接结构的优化可从两方面来考虑:
1、通过对WebLog的挖掘,发现用户访问页面的相关性,从而对密切联系的网页之间增加链接,方便用户使用。
2、利用路径分析技术判定在一个Web站点中访问最频繁的路径,可以选择把重要的商品信息放在这些页面中,改进页面和网站结构的设计,增强对客户的吸引力,提高销售量。
3、增强电子商务安全:Web的内容挖掘还包括挖掘存有客户登记信息的后台交易数据库。客户登记信息在电子商务话动中起着非常重要的作用,特别是在安全方面,或者在对客户可访问信息的限制方面。
4、搜索引擎的应用:通过对网页内容的挖掘,可以实现对网页的聚类和分类,实现网络信息的分类浏览与检索;通过用户使用的提问式历史记录分析,可以有效地进行提问扩展,提高用户的检索效果;通过运用Web挖掘技术改进关键词加权算法,可以提高网络信息的标引准确度,改善检索效果。
参考文献:
[1]董逸生.WEB挖掘研究综述.计算机科学.
[2]郝先臣,张德干,尹国成等.基于电子商务中的数据挖掘技术研究.小型微型计算机系统.