论文部分内容阅读
摘要:如何利用客户数据已经成为了电子商务目前最关注的问题。Web挖掘的出现,给电子商务所面临的问题提供了有效的解决途径。就这一问题,系统分析了客户在电子商务中的重要性以及对客户行为的Web挖掘。
关键词:电子商务;Web挖掘;客户行为
中图分类号:F224-39
文献标识码:A
文章编号:167Z-3198(2009)08-0237-02
1 电子商务中客户的重要性
营销学上有个著名的公式;100-1=0,即一个企业即使有100个客户对其感到很满意,但是只要有一个客户对持否定态度,企业的盛名就可能立即化为0,尽管这个观点有点夸大其实,但是至少它说明了一个问题,即:客户满意的重要性。
市场经济体制下,公司的目标就是为企业持股者争取利润的最大化,而公司的利润从何而来——客户。换句话说,为客户服务能创造长期的利益,而长期的利益又能够满足持股者的目的需求。虽然,使客户满意需要花更多的钱,同时也需要更长的周期,但是长周期加上大量的资金意味着企业更多的利益。所以,客户对企业的重要性是越来越突出。即使在电子商务领域这个遵循市场经济体制的网上交易体系。这一重要性也是同样符合的。
如今Google、Amazon、Yahoo、MSN等一些Web公司都要求员工运用Web挖掘技术来了解客户行为,并根据挖掘出的信息数据及模式设计更加符合客户需求的服务和产品。也就是说利用Web挖掘可以了解客户行为,其分析的数据结果可提供给企业参考,做出合适的调整策略。
2 客户行为的Web挖掘
2.1 挖掘数据来源
在挖掘过程中,关键性步骤是提供合适的挖掘对象。在电子商务中,客户行为挖掘的数据源,主要有以下几种:
(1)服务器日志文件。
Web服务器日志文件记录了客户每次登录浏览网站的行为信息,包括了IP地址、时间、页面等,是Web挖掘的主要数据源。
(2)Cookies日志文件。
Cookies是服务器为自动跟踪网站浏览者而在客户端生成的标志,用于存储类似于购物手推车状态信息或者浏览者所访问的电子商务网站的页面信息或交易信息等。
(3)客户信息。
客户信息指客户通过Web页在屏幕上输入的、要提交给服务器的相关信息。在电子商业网站须进行信用授权才能进行交易,因此客户大量的个人资料会传到网站上。对这些信息组织序化后,存储到数据仓库中可作为长期分析客户消费趋势的来源。
2.2 挖掘过程
对客户行为的Web挖掘并不是杂乱无序的,一般其过程可分为三个阶段:
(1)数据的预处理;
预处理主要对用户访问日志(包含用户的访问日志、引用日志和代理日志)进行过滤、反蜘蛛化、客户验证、会话和路径补全等处理,形成用户会话文件。
①过滤:收集完数据后,首要的步骤便是过滤出不想要的记录,为分析做准备。
②反蜘蛛化:所谓蜘蛛,就是搜索引擎对万维网的扫描建立索引的半自动化程序。蜘蛛的行为与人的行为不同(要比客户的全面),在数据处理中要把蜘蛛的行为和客户的行为区分开来,并过滤掉蜘蛛行为在服务器上的记录。
③客户验证:在会话之前必须识别客户,一是识别出同一客户在一次浏览中为建立会话而发出的页面请求,另一目的是识别在多次站点浏览的同一客户,使我们能够分析客户在数天,数月或是数年中的行为。
④会话;会话指客户在一次访问中访问的所有Web页面,通过这些可以反映出访问者对网站什么地方有兴趣或关心。
⑤路径补全;客户在浏览网时可能出现页面后退现象,导致路径损失,所以需要根据客户访问前后页面进行推理,补全访问路径。
(2)模式发现:
模式发现是对数据预处理所形成的用户会话文件,利用数据挖掘的一些有效算法,例如统计分析、关联规则、聚类、分类等。来发现隐藏的模式、规则。
①统计分析:统计方法是从电子商务网站中抽取知识的最常用的方法。可以根据选择的特征来分析网页此特征的点击次数,根据获得的数据结果来调整网站。
②关联规则:根据关联规则,可以从客户访问网站的行为中找出相关性。利用这些相关性,可以改进电子商务网站的结构,例如哪些产品可以摆在一起或捆绑销售。
③聚类和分类:聚类规则是从一组数据项中聚集出相似特征的一个聚类,可分为用户聚类和网页聚类。而分类规则是找出描述并区分数据类或概念的模型,并使用模型预测类标记未知的对象类。
(3)模式分析:
在这个阶段,主要是对挖掘出来的模式、规则进行分析,找出用户感兴趣的模式,并辅助理解。最常见的模式分析方法是采用sQL查询语句进行分析。另一种分析方法是先將数据导入并提供可视化的结果输出。
3 Web挖掘的应用
网络个性化服务是目前电子商务商业运作和发展的新方向,它根据用户兴趣、爱好、习惯,以及各个用户之间的相关性等向用户在线推荐商品,提供浏览建议,通过不定期调整网站的结构方便用户访问。动态地为用户定制个性化的网站等。
如今,许多商家一直在寻求识别有利可图的市场分割和追踪网络使用者的行为习惯,其目的是提醒用户他们可能感兴趣的产品的实用性。这就出现了像亚马逊网站那样的一种新模式,根据某一特殊用户可能感兴趣的问题提出所需信息。对于被特征化的用户,运用一些客户分类、挖掘技术,让他们了解所感兴趣产品的预报。
网络个性化服务的本质就是以客户为中心提供Web服务。首先,客户浏览访问电子商务网站的资源;其次,系统分析客户行为特性,创建访问模型;最后,根据所获取的信息知识调整服务,系统进行推荐来满足不同用户的个性化需求。通过客户与系统不断的交互,最终为客户提供个性化服务。
4 Web挖掘面临的问题
Web挖掘给电子商务带来新机遇的同时,也带来潜在的问题——隐私安全问题。网络的特点使得我们在网站上留下的信息几乎都可以被全世界获得。事实上,对用户数据的采集和挖掘,有些时候利用了用户的注册信息和登记信息,这包括客户姓名、性别、地址、出生年月、电话号码、购物习惯、收入、信用卡号码、电子邮件及经常访问的Web站点地址等私人信息。如果这些信息的利用未得到客户的允许,则会涉及到隐私权问题并产生纠纷。
如何对客户隐私进行保护,我们可以从三个方面着手:第一,立法进行强制性规范;第二,对涉及隐私的网上数据采取技术防范;第三,行业自律,不随意泄露客户信息,禁止买卖数据等。
5 结语
电子商务是现代信息技术发展的必然结果,也是未来商业运作模式的必然选择。运用Web挖掘技术对电子商务网站上的客户行为进行分析,挖掘出客户行为的知识模式,有助于企业更好的理解客户改善客户关系,减少费用支出并且增加网站灵活性,从而为企业带来更高的利益,也加快了电子商务的发展。
关键词:电子商务;Web挖掘;客户行为
中图分类号:F224-39
文献标识码:A
文章编号:167Z-3198(2009)08-0237-02
1 电子商务中客户的重要性
营销学上有个著名的公式;100-1=0,即一个企业即使有100个客户对其感到很满意,但是只要有一个客户对持否定态度,企业的盛名就可能立即化为0,尽管这个观点有点夸大其实,但是至少它说明了一个问题,即:客户满意的重要性。
市场经济体制下,公司的目标就是为企业持股者争取利润的最大化,而公司的利润从何而来——客户。换句话说,为客户服务能创造长期的利益,而长期的利益又能够满足持股者的目的需求。虽然,使客户满意需要花更多的钱,同时也需要更长的周期,但是长周期加上大量的资金意味着企业更多的利益。所以,客户对企业的重要性是越来越突出。即使在电子商务领域这个遵循市场经济体制的网上交易体系。这一重要性也是同样符合的。
如今Google、Amazon、Yahoo、MSN等一些Web公司都要求员工运用Web挖掘技术来了解客户行为,并根据挖掘出的信息数据及模式设计更加符合客户需求的服务和产品。也就是说利用Web挖掘可以了解客户行为,其分析的数据结果可提供给企业参考,做出合适的调整策略。
2 客户行为的Web挖掘
2.1 挖掘数据来源
在挖掘过程中,关键性步骤是提供合适的挖掘对象。在电子商务中,客户行为挖掘的数据源,主要有以下几种:
(1)服务器日志文件。
Web服务器日志文件记录了客户每次登录浏览网站的行为信息,包括了IP地址、时间、页面等,是Web挖掘的主要数据源。
(2)Cookies日志文件。
Cookies是服务器为自动跟踪网站浏览者而在客户端生成的标志,用于存储类似于购物手推车状态信息或者浏览者所访问的电子商务网站的页面信息或交易信息等。
(3)客户信息。
客户信息指客户通过Web页在屏幕上输入的、要提交给服务器的相关信息。在电子商业网站须进行信用授权才能进行交易,因此客户大量的个人资料会传到网站上。对这些信息组织序化后,存储到数据仓库中可作为长期分析客户消费趋势的来源。
2.2 挖掘过程
对客户行为的Web挖掘并不是杂乱无序的,一般其过程可分为三个阶段:
(1)数据的预处理;
预处理主要对用户访问日志(包含用户的访问日志、引用日志和代理日志)进行过滤、反蜘蛛化、客户验证、会话和路径补全等处理,形成用户会话文件。
①过滤:收集完数据后,首要的步骤便是过滤出不想要的记录,为分析做准备。
②反蜘蛛化:所谓蜘蛛,就是搜索引擎对万维网的扫描建立索引的半自动化程序。蜘蛛的行为与人的行为不同(要比客户的全面),在数据处理中要把蜘蛛的行为和客户的行为区分开来,并过滤掉蜘蛛行为在服务器上的记录。
③客户验证:在会话之前必须识别客户,一是识别出同一客户在一次浏览中为建立会话而发出的页面请求,另一目的是识别在多次站点浏览的同一客户,使我们能够分析客户在数天,数月或是数年中的行为。
④会话;会话指客户在一次访问中访问的所有Web页面,通过这些可以反映出访问者对网站什么地方有兴趣或关心。
⑤路径补全;客户在浏览网时可能出现页面后退现象,导致路径损失,所以需要根据客户访问前后页面进行推理,补全访问路径。
(2)模式发现:
模式发现是对数据预处理所形成的用户会话文件,利用数据挖掘的一些有效算法,例如统计分析、关联规则、聚类、分类等。来发现隐藏的模式、规则。
①统计分析:统计方法是从电子商务网站中抽取知识的最常用的方法。可以根据选择的特征来分析网页此特征的点击次数,根据获得的数据结果来调整网站。
②关联规则:根据关联规则,可以从客户访问网站的行为中找出相关性。利用这些相关性,可以改进电子商务网站的结构,例如哪些产品可以摆在一起或捆绑销售。
③聚类和分类:聚类规则是从一组数据项中聚集出相似特征的一个聚类,可分为用户聚类和网页聚类。而分类规则是找出描述并区分数据类或概念的模型,并使用模型预测类标记未知的对象类。
(3)模式分析:
在这个阶段,主要是对挖掘出来的模式、规则进行分析,找出用户感兴趣的模式,并辅助理解。最常见的模式分析方法是采用sQL查询语句进行分析。另一种分析方法是先將数据导入并提供可视化的结果输出。
3 Web挖掘的应用
网络个性化服务是目前电子商务商业运作和发展的新方向,它根据用户兴趣、爱好、习惯,以及各个用户之间的相关性等向用户在线推荐商品,提供浏览建议,通过不定期调整网站的结构方便用户访问。动态地为用户定制个性化的网站等。
如今,许多商家一直在寻求识别有利可图的市场分割和追踪网络使用者的行为习惯,其目的是提醒用户他们可能感兴趣的产品的实用性。这就出现了像亚马逊网站那样的一种新模式,根据某一特殊用户可能感兴趣的问题提出所需信息。对于被特征化的用户,运用一些客户分类、挖掘技术,让他们了解所感兴趣产品的预报。
网络个性化服务的本质就是以客户为中心提供Web服务。首先,客户浏览访问电子商务网站的资源;其次,系统分析客户行为特性,创建访问模型;最后,根据所获取的信息知识调整服务,系统进行推荐来满足不同用户的个性化需求。通过客户与系统不断的交互,最终为客户提供个性化服务。
4 Web挖掘面临的问题
Web挖掘给电子商务带来新机遇的同时,也带来潜在的问题——隐私安全问题。网络的特点使得我们在网站上留下的信息几乎都可以被全世界获得。事实上,对用户数据的采集和挖掘,有些时候利用了用户的注册信息和登记信息,这包括客户姓名、性别、地址、出生年月、电话号码、购物习惯、收入、信用卡号码、电子邮件及经常访问的Web站点地址等私人信息。如果这些信息的利用未得到客户的允许,则会涉及到隐私权问题并产生纠纷。
如何对客户隐私进行保护,我们可以从三个方面着手:第一,立法进行强制性规范;第二,对涉及隐私的网上数据采取技术防范;第三,行业自律,不随意泄露客户信息,禁止买卖数据等。
5 结语
电子商务是现代信息技术发展的必然结果,也是未来商业运作模式的必然选择。运用Web挖掘技术对电子商务网站上的客户行为进行分析,挖掘出客户行为的知识模式,有助于企业更好的理解客户改善客户关系,减少费用支出并且增加网站灵活性,从而为企业带来更高的利益,也加快了电子商务的发展。