论文部分内容阅读
摘 要:随着Internet的普及,电子商务已经成为现代企业进行商务活动的必然趋势,充分利用数据挖掘技术,可进行电子商务海量信息采集,辅助商家理解用户行为,从而改进站点结构,调整销售策略,提供个性化服务,首先介绍Web使用挖掘,然后分析了应用于电子商务中的Web挖掘技术,最后从优化网站设计、改善企业客户关系管理和改进企业网络营销三个方面阐述了Web使用挖掘的应用。
关键词:Web使用挖掘;电子商务;关联规则;路径分析
中图分类号:F27 文献标识码:A 文章编号:1672-3198(2009)07-0252-02
1 电子商务和Web使用挖掘
1.1 电子商务
电子商务是指个人或企业通过Internet,采用数字化电子方式进行商务数据交换和开展商务业务活动。通过电子商务,企业不再需要真正的实体店铺,而是在网上实时地发送商务信息,进行广告宣传,产品介绍,商务交易等,不仅可以大大降低广告费用和信息发布费用。且能增加时效性。由于不受时间和地域的限制,企业可以直接与Internet上的任何客户进行交易。客户可以足不出户、一天二十四小时地进行各种信息查询、商品查询、即时购物等活动,给客户带来了极大方便。
1.2 Web使用挖掘
Web使用挖掘是指通过对用户访问行为或Web日志的分析,从而获得有关用户的有用模式,建立起用户行为和兴趣模型。Web使用挖掘的数据对象包括客户端数据、服务器端数据和代理端数据。根据应用的不同,Web使用挖掘分为两种主要倾向:一般的访问模式追踪,个性化的使用记录追踪。
2 应用于电子商务平台的Web使用挖掘
2.1 关联规则分析
关联规则分析的目的就是为了挖掘出隐藏在数据间的关联规则。在电子商务中关联规则分析主要用于两个方面。
(1)发现用户访问的页面之间的关联规则,也就是挖掘群体用户访问页面之间的关联关系,构建关联模型,利用关联模型可以更好地组织站点结构,使网站的设计能方便用户浏览网站信息,另外利用关联模型可以提供用户导航,比如网站服务导航,网站信息导航,企业商品导航等,充分反映群体用户的需求。
(2)发现什么商品组或集合客户多半会一起购买,从而可以向客户提出推荐或者把相关的商品的链接放在一起,向客户提出推荐是找出客户所支持的关联规则,从而向客户提出客户可能会感兴趣的商品推荐。把相关的商品的链接放在一起是一个典型的购物篮分析,可以找出关联规则,看哪些商品经常同时被购买,从而把这些商品的链接放在一起,方便客户进行选购。
2.2 序列模式分析
(1)发现序列模式能够便于电子商务的组织者预测客户的行为,对客户提供个性化的服务,使用序列模式分析挖掘Web日志,可以发现客户的访问序列模式。通过访问者的访问序列模式,可以将他可能要访问而还未访问的页面放在显眼的位置,极大地方便用户的使用。另外也可以将访问者按序列访问模式分类,在页面上只展示具有该序列访问模式的访问者经常访问的链接。
(2)发现什么商品会在另外一些商品购买后购买,从而可以向客户提出推荐。在电子商务中,序列模式分析可以发现诸如“客户在线购买A商品后,一段時间里客户会接着在线购买商品B”的知识,形成一个客户行为的“A-B”模式,当一个客户链接到一个电子商务网站,就可以看一下这个客户的有关记录,看他支持哪个序列模式,如果客户已经购买了商品A,如果存在序列模式“A-B”,就可以动态的调整电子商务网站,把商品B的相关链接放到醒目的位置,并向客户提出推荐。
2.3 分类分析
分类分析可以挖掘某些共同的特性,这个特性可以用来对新添加到数据库里的数据项进行分类,在电子商务中,分类技术主要应用客户分类中,通过分析电子商务客户数据库中的数据,得到客户分类模式后,然后用这个分类规则对对新的客户进行分析,发现新的客户属于那一个类别,就可以针对不同类客户的特点展开不同的商务活动,提供有针对性的个性化的信息、服务,比如,信用卡公司根据客户的信用记录,把持卡人分成不同等级,。对于每一等级,找出它们共同点,有了这样的挖掘结果,客户服务部门就知道一个新的客户的潜在价值,在客户服务投入上就会更有针对性。
2.4 聚类分析
(1)通过挖掘Web服务器中用户的访问日志,对网络用户进行聚类,可以把具有相似浏览模式的用户集中起来聚类,根据聚类的结果,可以更好地理解用户的需求,从而为用户提供方便、优质的服务,例如,有一些客户这段时间经常浏览页面A,经过分析这些客户被聚类为一组,并且可以挖掘出这组客户的共性。这样,Web可自动给这组特定的客户聚类发送他们感兴趣的产品信息邮件,为这个客户聚类动态地改变一个特殊的站点。
(2)利用数据挖掘技术挖掘客户资料,将具有相似爱好的客户分配到相同的族中,聚类产生之后,根据族中其他客户对某商品的评价就可以得到该客户对该商品的评价,就可以同客户推荐可能感兴趣的商品。
2.5 路径分析
访问路径是用户在网络上浏览时,从一个网页到另一个网页的路径,路径分析就是寻找频繁访问路径的方法即通过对Web服务器的日志文件中客户访问站点的访问次数分析,挖掘出频繁访问路径。在电子商务中,路径分析应用于页面结构和内容的设计安排。
发现群体用户访问路径,改进站点的设计结构。利用热门路径分析,把相关联的物品摆放在一起有助于销售,站点上页面内容的安排和连接就如超级市场中物品在货架上的摆设一样,使客户访问的有关联的文件间的连接比较直接,让客户能够容易地访问到想访问的页面。
3 Web使用挖掘在电子商务中的应用
3.1 在电子商务网站设计中的应用
(1)改进网站结构设计。
通过关联规则分析可以发掘用户访问页面的群体模式。建立关联模型,改善网站的组织结构,使客户访问的有关联的文件间的链接更直接,容易地访问到想要的页面,尽量减少用户浏览的复杂度,使访问者感到舒适,停留足够长的时间来进行选购,通过序列模式分析可以发掘用户访问页面的序列,根据用户访问的序列模式,即按照大多数查找者的浏览模式对网站进行组织或重组,尽量为大多数查找者的浏览提供方便,利用路径分析技术判定在一个Web站点中最频繁的访问路径,根据这个路径来设计网站的结构和网页的链接,把重要的商品信息放在这些页面中。
(2)定制个性化界面。
对客户进行分类和聚类分析,根据用户的访问行为建立个性化的推荐系统,向客户提供个性化的服务和商品介绍,通过关联规则分析客户的访问行为信息,获取客户访问模式,针对客户动态的调整站点的结构,使客户访问的有 关联的文件间的连接比较直接,主动向客户提供商品推荐,帮助客户便捷地找到感兴趣的商品。可以根据客户当前购物车中的物品,向客户推荐一些相关的物品,运用序列模式挖掘客户在站点上导航的行为,可以根据客户的注册信息和订单纪录,向客户显示那些可能引起客户兴趣的新商品。
(3)提高Web站点的性能。
客户需要的是舒适的购物环境,要求网站系统能提供稳定、快速的服务。如果在购物过程中遇到网络拥挤、堵塞、断线甚至感染病毒等情况,肯定会影响心情。要改善上述情况,就要提高系统的性能,Web挖掘可以通過客户的拥塞记录发现站点的性能瓶颈,从而提示管理者改善有关的策略,提高网站的稳定性,增强系统安全性。
3.2 在CRM中的应用
3.2.1 提高客户驻留网站的时间
使客户在自己的网站上驻留更长的时间是保留老客户、活动新客户的关键,通过客户的浏览行为,了解客户的兴趣及需求,对客户进行聚类和分类,动态地调整Web页面,提供特有的一些商品信息和广告,以使客户满意,从而延长驻留的时间,另外运用序列模式发现技术挖掘出用户的浏览序列,得到客户浏览行为的信息,了解客户需求,根据需求动态向客户做页面推荐,并提供特有商品信息和广告,以使客户能继续保持访问站点的兴趣。
3.2.2 客户保持
客户保持就是让消费者不仅重复访问同一个站点,而且重复购买该站点的商品,首先对客户进行分类和聚类,每个类里的客户拥有相似的属性,而不同类里的客户的属性则不同。通过其他的Web挖掘技术可以发掘出每位访问者的个人爱好和个性化的需要,电子商务网站可以为每一类顾客的独特需求提供定制化的产品,并根据需求动态地向客户做页而推荐,调整Web页而,提高客户满意度。最终达到留住客户的目的。
3.2.3 开发新客户
数据挖掘能够辨别潜在的客户群,进行有针对性的客户开发。在对Web的客户访问信息的挖掘中,可以在In-ternet上找到潜在客户,对于一个新的访问者,通过在Web上的分类发现,识出这个客户与已经分类的老客户的一些公共的描述,从而对这个新客户进行正确的分类,然后从它的分类判断这个新客户是有利可图的客户群还是无利可图的客户群,决定是否要把这个新客户作为潜在的客户来对待,从而可以有的放矢地调整营销战略。如果发现某些客户为潜在客户群体,就可以将该类客户感兴趣的页面动态推荐给他们。
3.3 在网络营销中的应用
2.3.1 制定网络营销计划
制定网络营销计划前,要从时间和空间上进行Web挖掘。在时间上的挖掘就是通过对商品的访问和销售情况进行分析,从而获得客户的访问规律,确定顾客消费的生命周期,根据市场的变化,在特定的时间针对不同的产品制定相应的营销策略。在空间方面的挖掘就是可以对购买该商品的客户的进行域名分析,挖掘出该商品在哪个地区的销售情况最好,制定有关策略继续保持,同时挖掘出销售情况不理想的可以拓展市场的地区。
2.3.2 一对一营销
网络营销的中心内容是实现以数据库为基础的一对一营销,满足个性化拘客户需求。企业可以利用分类与聚类技术把客户分类,每一类中的客户拥有相似的属性,这样,企业可以给每一类客户提供不同的服务,提高客户的满意度。
2.3.3 交叉营销
交叉营销是指向老客户销售新产品。对于原有客户,企业可以比较容易地得到关于这个客户的比较丰富的信息,在企业所掌握的客户信息可能正包含着这个客户决定他下一个购买行为的关键,甚至决定因素。采用关联规则和序列模式分析,可以从客户信息尤其是以前购买行为的信息中,寻找影响客户购买行为的因素,并建立预测模型对客户将来的购买行为进行预测分析,分析哪些客户最有可能对企业的产品感兴趣,会对哪些相关产品感兴趣,客户购买某类产品的可能性有多大,来决定对哪些客户进行交叉销售,对这些客户提义哪一种产品最为合适。
4 结语
电子商务是未来企业进行商业交易发展的必然趋势,它改变了企业的商务活动方式,也改变了人们的消费方式。Web挖掘是数据挖掘中的前沿技术,应用Web挖掘技术,能使电子商务网站资源的配置更合理化,能发现隐含的有价值的信息,改进网站设计,找到潜在的客户、为已有客户提供更好的个性化服务,电子商务中仍然存在着许多不完善的地方,但是其应用将会越来越广泛和深入。
关键词:Web使用挖掘;电子商务;关联规则;路径分析
中图分类号:F27 文献标识码:A 文章编号:1672-3198(2009)07-0252-02
1 电子商务和Web使用挖掘
1.1 电子商务
电子商务是指个人或企业通过Internet,采用数字化电子方式进行商务数据交换和开展商务业务活动。通过电子商务,企业不再需要真正的实体店铺,而是在网上实时地发送商务信息,进行广告宣传,产品介绍,商务交易等,不仅可以大大降低广告费用和信息发布费用。且能增加时效性。由于不受时间和地域的限制,企业可以直接与Internet上的任何客户进行交易。客户可以足不出户、一天二十四小时地进行各种信息查询、商品查询、即时购物等活动,给客户带来了极大方便。
1.2 Web使用挖掘
Web使用挖掘是指通过对用户访问行为或Web日志的分析,从而获得有关用户的有用模式,建立起用户行为和兴趣模型。Web使用挖掘的数据对象包括客户端数据、服务器端数据和代理端数据。根据应用的不同,Web使用挖掘分为两种主要倾向:一般的访问模式追踪,个性化的使用记录追踪。
2 应用于电子商务平台的Web使用挖掘
2.1 关联规则分析
关联规则分析的目的就是为了挖掘出隐藏在数据间的关联规则。在电子商务中关联规则分析主要用于两个方面。
(1)发现用户访问的页面之间的关联规则,也就是挖掘群体用户访问页面之间的关联关系,构建关联模型,利用关联模型可以更好地组织站点结构,使网站的设计能方便用户浏览网站信息,另外利用关联模型可以提供用户导航,比如网站服务导航,网站信息导航,企业商品导航等,充分反映群体用户的需求。
(2)发现什么商品组或集合客户多半会一起购买,从而可以向客户提出推荐或者把相关的商品的链接放在一起,向客户提出推荐是找出客户所支持的关联规则,从而向客户提出客户可能会感兴趣的商品推荐。把相关的商品的链接放在一起是一个典型的购物篮分析,可以找出关联规则,看哪些商品经常同时被购买,从而把这些商品的链接放在一起,方便客户进行选购。
2.2 序列模式分析
(1)发现序列模式能够便于电子商务的组织者预测客户的行为,对客户提供个性化的服务,使用序列模式分析挖掘Web日志,可以发现客户的访问序列模式。通过访问者的访问序列模式,可以将他可能要访问而还未访问的页面放在显眼的位置,极大地方便用户的使用。另外也可以将访问者按序列访问模式分类,在页面上只展示具有该序列访问模式的访问者经常访问的链接。
(2)发现什么商品会在另外一些商品购买后购买,从而可以向客户提出推荐。在电子商务中,序列模式分析可以发现诸如“客户在线购买A商品后,一段時间里客户会接着在线购买商品B”的知识,形成一个客户行为的“A-B”模式,当一个客户链接到一个电子商务网站,就可以看一下这个客户的有关记录,看他支持哪个序列模式,如果客户已经购买了商品A,如果存在序列模式“A-B”,就可以动态的调整电子商务网站,把商品B的相关链接放到醒目的位置,并向客户提出推荐。
2.3 分类分析
分类分析可以挖掘某些共同的特性,这个特性可以用来对新添加到数据库里的数据项进行分类,在电子商务中,分类技术主要应用客户分类中,通过分析电子商务客户数据库中的数据,得到客户分类模式后,然后用这个分类规则对对新的客户进行分析,发现新的客户属于那一个类别,就可以针对不同类客户的特点展开不同的商务活动,提供有针对性的个性化的信息、服务,比如,信用卡公司根据客户的信用记录,把持卡人分成不同等级,。对于每一等级,找出它们共同点,有了这样的挖掘结果,客户服务部门就知道一个新的客户的潜在价值,在客户服务投入上就会更有针对性。
2.4 聚类分析
(1)通过挖掘Web服务器中用户的访问日志,对网络用户进行聚类,可以把具有相似浏览模式的用户集中起来聚类,根据聚类的结果,可以更好地理解用户的需求,从而为用户提供方便、优质的服务,例如,有一些客户这段时间经常浏览页面A,经过分析这些客户被聚类为一组,并且可以挖掘出这组客户的共性。这样,Web可自动给这组特定的客户聚类发送他们感兴趣的产品信息邮件,为这个客户聚类动态地改变一个特殊的站点。
(2)利用数据挖掘技术挖掘客户资料,将具有相似爱好的客户分配到相同的族中,聚类产生之后,根据族中其他客户对某商品的评价就可以得到该客户对该商品的评价,就可以同客户推荐可能感兴趣的商品。
2.5 路径分析
访问路径是用户在网络上浏览时,从一个网页到另一个网页的路径,路径分析就是寻找频繁访问路径的方法即通过对Web服务器的日志文件中客户访问站点的访问次数分析,挖掘出频繁访问路径。在电子商务中,路径分析应用于页面结构和内容的设计安排。
发现群体用户访问路径,改进站点的设计结构。利用热门路径分析,把相关联的物品摆放在一起有助于销售,站点上页面内容的安排和连接就如超级市场中物品在货架上的摆设一样,使客户访问的有关联的文件间的连接比较直接,让客户能够容易地访问到想访问的页面。
3 Web使用挖掘在电子商务中的应用
3.1 在电子商务网站设计中的应用
(1)改进网站结构设计。
通过关联规则分析可以发掘用户访问页面的群体模式。建立关联模型,改善网站的组织结构,使客户访问的有关联的文件间的链接更直接,容易地访问到想要的页面,尽量减少用户浏览的复杂度,使访问者感到舒适,停留足够长的时间来进行选购,通过序列模式分析可以发掘用户访问页面的序列,根据用户访问的序列模式,即按照大多数查找者的浏览模式对网站进行组织或重组,尽量为大多数查找者的浏览提供方便,利用路径分析技术判定在一个Web站点中最频繁的访问路径,根据这个路径来设计网站的结构和网页的链接,把重要的商品信息放在这些页面中。
(2)定制个性化界面。
对客户进行分类和聚类分析,根据用户的访问行为建立个性化的推荐系统,向客户提供个性化的服务和商品介绍,通过关联规则分析客户的访问行为信息,获取客户访问模式,针对客户动态的调整站点的结构,使客户访问的有 关联的文件间的连接比较直接,主动向客户提供商品推荐,帮助客户便捷地找到感兴趣的商品。可以根据客户当前购物车中的物品,向客户推荐一些相关的物品,运用序列模式挖掘客户在站点上导航的行为,可以根据客户的注册信息和订单纪录,向客户显示那些可能引起客户兴趣的新商品。
(3)提高Web站点的性能。
客户需要的是舒适的购物环境,要求网站系统能提供稳定、快速的服务。如果在购物过程中遇到网络拥挤、堵塞、断线甚至感染病毒等情况,肯定会影响心情。要改善上述情况,就要提高系统的性能,Web挖掘可以通過客户的拥塞记录发现站点的性能瓶颈,从而提示管理者改善有关的策略,提高网站的稳定性,增强系统安全性。
3.2 在CRM中的应用
3.2.1 提高客户驻留网站的时间
使客户在自己的网站上驻留更长的时间是保留老客户、活动新客户的关键,通过客户的浏览行为,了解客户的兴趣及需求,对客户进行聚类和分类,动态地调整Web页面,提供特有的一些商品信息和广告,以使客户满意,从而延长驻留的时间,另外运用序列模式发现技术挖掘出用户的浏览序列,得到客户浏览行为的信息,了解客户需求,根据需求动态向客户做页面推荐,并提供特有商品信息和广告,以使客户能继续保持访问站点的兴趣。
3.2.2 客户保持
客户保持就是让消费者不仅重复访问同一个站点,而且重复购买该站点的商品,首先对客户进行分类和聚类,每个类里的客户拥有相似的属性,而不同类里的客户的属性则不同。通过其他的Web挖掘技术可以发掘出每位访问者的个人爱好和个性化的需要,电子商务网站可以为每一类顾客的独特需求提供定制化的产品,并根据需求动态地向客户做页而推荐,调整Web页而,提高客户满意度。最终达到留住客户的目的。
3.2.3 开发新客户
数据挖掘能够辨别潜在的客户群,进行有针对性的客户开发。在对Web的客户访问信息的挖掘中,可以在In-ternet上找到潜在客户,对于一个新的访问者,通过在Web上的分类发现,识出这个客户与已经分类的老客户的一些公共的描述,从而对这个新客户进行正确的分类,然后从它的分类判断这个新客户是有利可图的客户群还是无利可图的客户群,决定是否要把这个新客户作为潜在的客户来对待,从而可以有的放矢地调整营销战略。如果发现某些客户为潜在客户群体,就可以将该类客户感兴趣的页面动态推荐给他们。
3.3 在网络营销中的应用
2.3.1 制定网络营销计划
制定网络营销计划前,要从时间和空间上进行Web挖掘。在时间上的挖掘就是通过对商品的访问和销售情况进行分析,从而获得客户的访问规律,确定顾客消费的生命周期,根据市场的变化,在特定的时间针对不同的产品制定相应的营销策略。在空间方面的挖掘就是可以对购买该商品的客户的进行域名分析,挖掘出该商品在哪个地区的销售情况最好,制定有关策略继续保持,同时挖掘出销售情况不理想的可以拓展市场的地区。
2.3.2 一对一营销
网络营销的中心内容是实现以数据库为基础的一对一营销,满足个性化拘客户需求。企业可以利用分类与聚类技术把客户分类,每一类中的客户拥有相似的属性,这样,企业可以给每一类客户提供不同的服务,提高客户的满意度。
2.3.3 交叉营销
交叉营销是指向老客户销售新产品。对于原有客户,企业可以比较容易地得到关于这个客户的比较丰富的信息,在企业所掌握的客户信息可能正包含着这个客户决定他下一个购买行为的关键,甚至决定因素。采用关联规则和序列模式分析,可以从客户信息尤其是以前购买行为的信息中,寻找影响客户购买行为的因素,并建立预测模型对客户将来的购买行为进行预测分析,分析哪些客户最有可能对企业的产品感兴趣,会对哪些相关产品感兴趣,客户购买某类产品的可能性有多大,来决定对哪些客户进行交叉销售,对这些客户提义哪一种产品最为合适。
4 结语
电子商务是未来企业进行商业交易发展的必然趋势,它改变了企业的商务活动方式,也改变了人们的消费方式。Web挖掘是数据挖掘中的前沿技术,应用Web挖掘技术,能使电子商务网站资源的配置更合理化,能发现隐含的有价值的信息,改进网站设计,找到潜在的客户、为已有客户提供更好的个性化服务,电子商务中仍然存在着许多不完善的地方,但是其应用将会越来越广泛和深入。