论文部分内容阅读
[摘 要] 随着Internet的发展,个性化信息服务已经被广泛应用到很多领域.本文阐述了电子商务个性化服务的数据挖掘方法,并对电子商务个性化服务的实现进行了探讨。
[关键词] 数据挖掘 Web访问信息挖掘 个性化服务 电子商务
一、引 言
随着internet技术的发展,个性化信息服务已经被广泛应用到很多领域:如个性化导航、个性化网站等。尤其是在电子商务领域,对用户进行个性化服务,已经成为许多电子商务企业追求的目标。
WEB访问信息挖掘就是对用户访问WEB时在服务方留下的访问记录进行挖掘,即对用户访问WEB站点的存取方式进行挖掘。挖掘对象是在服务器上的包括server log data等在内的日志文件记录。
二、电子商务个性化服务的数据挖掘方法
访问信息挖掘是在电子商务上进行知识发现,最关键的是进行客户访问信息的挖掘,得到客户的浏览行为和访问模式,从而发现客户的兴趣、爱好等有用的市场信息,最常用的挖掘方法有:
1.路径分析
常用于判定在一个web站点中最频繁访问的路径。如:80%的用户在存取/company/prodcut1时是经过/company/new。通过客户访问的路径分析,可以改进页面和网站目录结构的设计,使用户直奔所需,减少客户的流失率。
2.关联规则挖掘
使用关联规则挖掘可以从WEB访问事务集中,找到一般性的关联知识。如:30%的客户在访问/company/prodcut1也访问了/company/prodcut2。利用这些相关性,可更好地组织WEB空间,实施有效的营销策略。
3.序列模式发现
序列模式发现就是在时间戳有序的事务集中,找到那些“一些项跟随另一些项”的内部事务模式,即挖掘出交易集之间有时间序列关系的模式。如:在company/prodcut1上进行订购的用户中有60%的在一个月内也订购了company/prodcut2。序列模式发现能够预测客户的访问模式,了解客户的兴趣及需求所在,采取有针对性的广告服务,以满足访问者的特定要求。
4.分类
分类就是为具有某些公共属性的特定群体建立概要特征,这些特征可以用来对新增到数据库里的数据项进行分类。如学生用户一般感兴趣的页面是company/prodcut1。分类能够使商家根据访问网站的人口统计学信息和用户的访问模式得出访问某一商业网站的用户轮廓特征。对用户分类后,就可以发现未来的潜在客户并开展有针对性的商务活动。
5.聚类分析
聚类分析可以从服务器访问信息数据中聚集出具有相似特性的客户组,即把有相似特性的用户、数据项集合到一起。如自动给一个待定的顾客聚类发送销售邮件。通过这些举措使商务活动能够在一定程度上满足客户的要求,实现目标营销。
三、电子商务个性化服务的实现
1.Web访问信息挖掘基本步骤
Web访问信息挖掘的基本步骤为:数据收集,数据预处理,模式识别,模式分析。
数据收集就是要记录用户访问行为,主要方式有在服务器端进行数据收集、在客户端进行数据收集、在代理端进行数据收集等。原始数据需要经过预处理后才能有效实施挖掘算法,数据预处理的质量与Web挖掘的效率和结果紧密相关,其内容包括:数据净化、用户识别、会话识别、事务识别、路径补充等。然后要对预处理后的数据进行模式识别,即实施挖掘算法。模式分析的目的是根据实际应用,通过观察和选择,把发现的统计结果、规则和模型转换为知识,经过筛选后用来指导实际的电子商务行为。常用的手段有:信息过滤、可视化、联机分析处理等。
2.电子商务个性化系统结构
电子商务个性化系统如下图所示。
通过上图可知,电子商务个性化系统一般分为两个部分:
离线部分:用于挖掘用户的特性信息。
在线部分:用于识别用户,推荐个性化服务。
Web访问信息挖掘是离线处理的,而当用户访问该网站时通过在线推荐引擎进行在线服务。挖掘算法和推荐策略可以根据不同类型站点的要求来具体选择,挖掘结果和推荐集通过推荐引擎反馈给用户。电子商务网站的会员用户通过会员标识登录网站以后,其访问信息将会被记录到服务器端。这些数据将在经过预处理后,在专用的数据挖掘模块中,通过具体的挖掘算法和推荐策略来进行模式识别和模式分析。用户访问信息也会传到推荐引擎,推荐引擎根据用户的会员标识,向挖掘模块抽取对应用户的挖掘结果和推荐集,将其可视化地反馈给用户,达到个性化服务的目的。
四、结束语
随着互联网的普及和电子商务的发展,电子商务系统在为用户提供越来越多选择的同时,利用WEB访问信息挖掘技术,必然对电子商务网站提供个性化服务产生积极的影响。
参考文献:
[1]毛国君 段立娟:数据挖掘原理与算法[M].清华大学出版社,2005.7
[2]冯是聪 单松魏 张志刚:基于Web挖掘的个性化技术研究.计算机工程与设计, 2004 Vol.25 No.1
[关键词] 数据挖掘 Web访问信息挖掘 个性化服务 电子商务
一、引 言
随着internet技术的发展,个性化信息服务已经被广泛应用到很多领域:如个性化导航、个性化网站等。尤其是在电子商务领域,对用户进行个性化服务,已经成为许多电子商务企业追求的目标。
WEB访问信息挖掘就是对用户访问WEB时在服务方留下的访问记录进行挖掘,即对用户访问WEB站点的存取方式进行挖掘。挖掘对象是在服务器上的包括server log data等在内的日志文件记录。
二、电子商务个性化服务的数据挖掘方法
访问信息挖掘是在电子商务上进行知识发现,最关键的是进行客户访问信息的挖掘,得到客户的浏览行为和访问模式,从而发现客户的兴趣、爱好等有用的市场信息,最常用的挖掘方法有:
1.路径分析
常用于判定在一个web站点中最频繁访问的路径。如:80%的用户在存取/company/prodcut1时是经过/company/new。通过客户访问的路径分析,可以改进页面和网站目录结构的设计,使用户直奔所需,减少客户的流失率。
2.关联规则挖掘
使用关联规则挖掘可以从WEB访问事务集中,找到一般性的关联知识。如:30%的客户在访问/company/prodcut1也访问了/company/prodcut2。利用这些相关性,可更好地组织WEB空间,实施有效的营销策略。
3.序列模式发现
序列模式发现就是在时间戳有序的事务集中,找到那些“一些项跟随另一些项”的内部事务模式,即挖掘出交易集之间有时间序列关系的模式。如:在company/prodcut1上进行订购的用户中有60%的在一个月内也订购了company/prodcut2。序列模式发现能够预测客户的访问模式,了解客户的兴趣及需求所在,采取有针对性的广告服务,以满足访问者的特定要求。
4.分类
分类就是为具有某些公共属性的特定群体建立概要特征,这些特征可以用来对新增到数据库里的数据项进行分类。如学生用户一般感兴趣的页面是company/prodcut1。分类能够使商家根据访问网站的人口统计学信息和用户的访问模式得出访问某一商业网站的用户轮廓特征。对用户分类后,就可以发现未来的潜在客户并开展有针对性的商务活动。
5.聚类分析
聚类分析可以从服务器访问信息数据中聚集出具有相似特性的客户组,即把有相似特性的用户、数据项集合到一起。如自动给一个待定的顾客聚类发送销售邮件。通过这些举措使商务活动能够在一定程度上满足客户的要求,实现目标营销。
三、电子商务个性化服务的实现
1.Web访问信息挖掘基本步骤
Web访问信息挖掘的基本步骤为:数据收集,数据预处理,模式识别,模式分析。
数据收集就是要记录用户访问行为,主要方式有在服务器端进行数据收集、在客户端进行数据收集、在代理端进行数据收集等。原始数据需要经过预处理后才能有效实施挖掘算法,数据预处理的质量与Web挖掘的效率和结果紧密相关,其内容包括:数据净化、用户识别、会话识别、事务识别、路径补充等。然后要对预处理后的数据进行模式识别,即实施挖掘算法。模式分析的目的是根据实际应用,通过观察和选择,把发现的统计结果、规则和模型转换为知识,经过筛选后用来指导实际的电子商务行为。常用的手段有:信息过滤、可视化、联机分析处理等。
2.电子商务个性化系统结构
电子商务个性化系统如下图所示。
通过上图可知,电子商务个性化系统一般分为两个部分:
离线部分:用于挖掘用户的特性信息。
在线部分:用于识别用户,推荐个性化服务。
Web访问信息挖掘是离线处理的,而当用户访问该网站时通过在线推荐引擎进行在线服务。挖掘算法和推荐策略可以根据不同类型站点的要求来具体选择,挖掘结果和推荐集通过推荐引擎反馈给用户。电子商务网站的会员用户通过会员标识登录网站以后,其访问信息将会被记录到服务器端。这些数据将在经过预处理后,在专用的数据挖掘模块中,通过具体的挖掘算法和推荐策略来进行模式识别和模式分析。用户访问信息也会传到推荐引擎,推荐引擎根据用户的会员标识,向挖掘模块抽取对应用户的挖掘结果和推荐集,将其可视化地反馈给用户,达到个性化服务的目的。
四、结束语
随着互联网的普及和电子商务的发展,电子商务系统在为用户提供越来越多选择的同时,利用WEB访问信息挖掘技术,必然对电子商务网站提供个性化服务产生积极的影响。
参考文献:
[1]毛国君 段立娟:数据挖掘原理与算法[M].清华大学出版社,2005.7
[2]冯是聪 单松魏 张志刚:基于Web挖掘的个性化技术研究.计算机工程与设计, 2004 Vol.25 No.1