论文部分内容阅读
[摘 要] 本文对数据挖掘的基本特点与流程和电子商务中Web数据挖掘与数据源进行了分析,并对数据挖掘技术在电子商务领域的应用进行了研究探讨
[关键词] 数据挖掘 电子商务 数据源 应用
一、数据挖掘的基本特点与流程分析
数据挖掘定义为是从存放在数据库、数据仓库或其他信息库中的大量数据中挖掘有趣知识的过程。
数据挖掘系统具有以下几个主要部分:
1.数据库、数据仓库或其他信息库:这是一个或一组数据库、数据仓库、电子表格或其他类型的信息库,可以在数据上进行数据清理和集成。
2.数据库或数据仓库服务器:以用户为主导的交互式数据挖掘过程一般是通过系统的用户界面模块,将用户的搜索指令转化为一组标准的SQL语句,交由服务器去执行。
3.数据挖掘引擎:这是数据挖掘系统的基本部分,是由一组以系统为主导的数据挖掘功能模块组成的。
4.模式评估模块:此模块一般使用兴趣度指标并与数据挖掘模块交互作用,指导数据挖掘引擎将搜索集中在感兴趣的模式上。
5.知识库:知识库包含着领域知识,用于指导搜索过程,并计算评估结果模式的兴趣度指标。
6.图形用户界面:本模块在用户和数据挖掘系统之间通讯,允许用户与系统交互,指定数据挖掘查询或任务,提供信息,帮助确定搜索目标,根据数据挖掘的中间结果进行探索式的数据挖掘。
二、电子商务中的Web数据挖掘与数据源
根据对Web数据的感兴趣程度不同,Web数据挖掘一般可以分为三类:Web内容挖掘(Web Contentmining)、Web结构挖掘(Web structure mining)、Web用法挖掘(Web usage Mining)。
1.Web内容挖掘。Web内容挖掘指从Web内容中发现有用信息。Web上的信息由各种类型的数据源组成,包括WWW、FTP、Telnet等,比如政府信息服务、数字图书馆、电子商务数据,以及其他通过Web可以访问的数据库。
2.Web结构挖掘。从广义上讲,Web的结构包含以下三个内容;不同网页间的超链接;网页内部的URL字符串中的目录路径结构信息;网页内部内容的可以用HTML、XML表示成的树形结构信息。
3.Web用法挖掘(Web usage Mining)。即Web使用纪录挖掘,在新兴的电子商务领域有重要意义,它通过挖掘相关的Web日志纪录,来发现用户访问Web页面的模式,通过分析日志纪录中的规律,可以识别用户的忠实度、喜好、满意度,因而可以发现潜在用户,增强站点的服务竞争力。
在数据挖掘中一个很重要的步骤就是采集数据。在Web上可以用来作为数据挖掘分析的数据量比较大,而且类型众多。电子商务的数据挖掘技术中,数据的来源主要有以下几个方面:
一是服务器数据。客户访问站点时会在Web服务器上留下相应的日志数据,这些日志数据通常以文本文件的形式存储在服务器上。一般包括sever logs、error logs、cookie logs等。
二是查询数据。它是电子商务站点在服务器上产生的一种典型数据。
三是在线市场数据。这类数据主要是传统关系数据库里存储的有关电子商务站点信息、用户购买信息、商品信息等数据。
四是Web页面。主要是指HTML和XML页面的内容,包括本文、图片、语音、图像等。
五是Web页面超级链接关系。主要是指页面之间存在的超级链接关系,这也是一种重要的资源。
六是客户登记信息。客户登记信息是指客户通过Web网页输入的、要提交给服务器的相关用户信息,这些信息通常是关于用户的人口特征信息。
三、Web数据挖掘在电子商务中的应用
1.发现潜在客户。通过Web数据挖掘,对新访问者的网页浏览纪录进行分析,就可以判断出该访问者是属于哪一类客户,是有利可图的潜在客户还是毫无价值的过客,从而挖掘潜在客户。
2.个性化定制,提高客户忠诚度。通过对客户访问信息的挖掘,就能知道客户的浏览行为,从而识别用户的忠实度、喜好、满意度,了解客户的兴趣及需求,动态地调整Web页面以满足客户的需要。
3.改进站点设计。站点的结构和内容是吸引用户的关键。Web挖掘技术通过挖掘用户的行为纪录和反馈情况为站点设计者提供改进的依据,比如页面连接情况应如何组织、那些页面应能够直接访问等。
4.聚类客户。在电子商务中客户聚类是一个重要的方面。通过分组具有相似浏览行为的客户并分析组中客户的共同特征,可以帮助电子商务的组织者更好地了解自己的客户,及时调整页面及页面内容使商务活动能够在更大程度上满足客户的要求,向客户提供更适合、更面向客户的服务,使商务活动对客户和销售商来说更具意义。
5.广告效益评价。利用Web挖掘对大量消费行为模式进行分析,可精确地评价各种广告手段的效益,并组合设计出最佳的商品宣传组合方案,根据关心某产品的访问者的浏览模式来决定广告的位置,增加广告针对性,提高广告的投资回报率。
无论Web挖掘技术还是基于它的电子商务,都是综合性很强的新技术,需要进一步的完善和发展。作为实现电子商务的关键技术之一,Web挖掘技术具有良好的发展和应用前景,已受到并将越来越得到更加广泛的关注。
参考文献:
[1]吕延杰:《电子商务教程》.电子工业出版社,2000年版
[2]王永庆:《人工智能原理与方法》.西安交通大学出版社,1998年版
[3]林杰斌 刘明德 陈 湘:《数据挖掘与OLAP理论与务实》,清华大学出版社,2003年版
[4]袁 柱:《电子商务中Web数据挖掘的应用研究》.《商场现代化》,2007年第8S期
[5]姚国章:《中国企业电子商务发展战略》.北京大学出版社,2001年版
[关键词] 数据挖掘 电子商务 数据源 应用
一、数据挖掘的基本特点与流程分析
数据挖掘定义为是从存放在数据库、数据仓库或其他信息库中的大量数据中挖掘有趣知识的过程。
数据挖掘系统具有以下几个主要部分:
1.数据库、数据仓库或其他信息库:这是一个或一组数据库、数据仓库、电子表格或其他类型的信息库,可以在数据上进行数据清理和集成。
2.数据库或数据仓库服务器:以用户为主导的交互式数据挖掘过程一般是通过系统的用户界面模块,将用户的搜索指令转化为一组标准的SQL语句,交由服务器去执行。
3.数据挖掘引擎:这是数据挖掘系统的基本部分,是由一组以系统为主导的数据挖掘功能模块组成的。
4.模式评估模块:此模块一般使用兴趣度指标并与数据挖掘模块交互作用,指导数据挖掘引擎将搜索集中在感兴趣的模式上。
5.知识库:知识库包含着领域知识,用于指导搜索过程,并计算评估结果模式的兴趣度指标。
6.图形用户界面:本模块在用户和数据挖掘系统之间通讯,允许用户与系统交互,指定数据挖掘查询或任务,提供信息,帮助确定搜索目标,根据数据挖掘的中间结果进行探索式的数据挖掘。
二、电子商务中的Web数据挖掘与数据源
根据对Web数据的感兴趣程度不同,Web数据挖掘一般可以分为三类:Web内容挖掘(Web Contentmining)、Web结构挖掘(Web structure mining)、Web用法挖掘(Web usage Mining)。
1.Web内容挖掘。Web内容挖掘指从Web内容中发现有用信息。Web上的信息由各种类型的数据源组成,包括WWW、FTP、Telnet等,比如政府信息服务、数字图书馆、电子商务数据,以及其他通过Web可以访问的数据库。
2.Web结构挖掘。从广义上讲,Web的结构包含以下三个内容;不同网页间的超链接;网页内部的URL字符串中的目录路径结构信息;网页内部内容的可以用HTML、XML表示成的树形结构信息。
3.Web用法挖掘(Web usage Mining)。即Web使用纪录挖掘,在新兴的电子商务领域有重要意义,它通过挖掘相关的Web日志纪录,来发现用户访问Web页面的模式,通过分析日志纪录中的规律,可以识别用户的忠实度、喜好、满意度,因而可以发现潜在用户,增强站点的服务竞争力。
在数据挖掘中一个很重要的步骤就是采集数据。在Web上可以用来作为数据挖掘分析的数据量比较大,而且类型众多。电子商务的数据挖掘技术中,数据的来源主要有以下几个方面:
一是服务器数据。客户访问站点时会在Web服务器上留下相应的日志数据,这些日志数据通常以文本文件的形式存储在服务器上。一般包括sever logs、error logs、cookie logs等。
二是查询数据。它是电子商务站点在服务器上产生的一种典型数据。
三是在线市场数据。这类数据主要是传统关系数据库里存储的有关电子商务站点信息、用户购买信息、商品信息等数据。
四是Web页面。主要是指HTML和XML页面的内容,包括本文、图片、语音、图像等。
五是Web页面超级链接关系。主要是指页面之间存在的超级链接关系,这也是一种重要的资源。
六是客户登记信息。客户登记信息是指客户通过Web网页输入的、要提交给服务器的相关用户信息,这些信息通常是关于用户的人口特征信息。
三、Web数据挖掘在电子商务中的应用
1.发现潜在客户。通过Web数据挖掘,对新访问者的网页浏览纪录进行分析,就可以判断出该访问者是属于哪一类客户,是有利可图的潜在客户还是毫无价值的过客,从而挖掘潜在客户。
2.个性化定制,提高客户忠诚度。通过对客户访问信息的挖掘,就能知道客户的浏览行为,从而识别用户的忠实度、喜好、满意度,了解客户的兴趣及需求,动态地调整Web页面以满足客户的需要。
3.改进站点设计。站点的结构和内容是吸引用户的关键。Web挖掘技术通过挖掘用户的行为纪录和反馈情况为站点设计者提供改进的依据,比如页面连接情况应如何组织、那些页面应能够直接访问等。
4.聚类客户。在电子商务中客户聚类是一个重要的方面。通过分组具有相似浏览行为的客户并分析组中客户的共同特征,可以帮助电子商务的组织者更好地了解自己的客户,及时调整页面及页面内容使商务活动能够在更大程度上满足客户的要求,向客户提供更适合、更面向客户的服务,使商务活动对客户和销售商来说更具意义。
5.广告效益评价。利用Web挖掘对大量消费行为模式进行分析,可精确地评价各种广告手段的效益,并组合设计出最佳的商品宣传组合方案,根据关心某产品的访问者的浏览模式来决定广告的位置,增加广告针对性,提高广告的投资回报率。
无论Web挖掘技术还是基于它的电子商务,都是综合性很强的新技术,需要进一步的完善和发展。作为实现电子商务的关键技术之一,Web挖掘技术具有良好的发展和应用前景,已受到并将越来越得到更加广泛的关注。
参考文献:
[1]吕延杰:《电子商务教程》.电子工业出版社,2000年版
[2]王永庆:《人工智能原理与方法》.西安交通大学出版社,1998年版
[3]林杰斌 刘明德 陈 湘:《数据挖掘与OLAP理论与务实》,清华大学出版社,2003年版
[4]袁 柱:《电子商务中Web数据挖掘的应用研究》.《商场现代化》,2007年第8S期
[5]姚国章:《中国企业电子商务发展战略》.北京大学出版社,2001年版