论文部分内容阅读
【摘要】本文阐述了研究数据挖掘技术在客户关系管理(CRM)中所起的核心作用、对我国企业成功实施CRM战略、提高竞争能力的意义及数据挖掘技术流程、标准化模型。
【关键词】客户关系管理;数据挖掘;流程;模型
随着市场经济的发展,企业将面临强大的竞争压力,企业的产品越来越趋向于同质化,仅仅依靠产品本身很难在日趋激烈的竞争中取胜,所以愈来愈多的先进企业将重点从以产品为中心向以客户为中心的新型商业模式转移,客户关系管理(CRM)也就应运而生。客户关系管理(Customer Relationship Management)简称CRM,是由美国的Gartner Group me公司于1999年首先提出的。CRM是一种以客户为中心的经营策略,它以信息技术为手段,并对工作流程进行重组,以赋予企业更完善的客户交流能力,最大化客户的收益率。CRM就是企业为了保持竞争力,采取的面向客户、客户驱动和以客户为中心的发展策略。而企业在与客户交互过程中积累下来的各种客户数据恰恰是反映客户特征和需求的最佳载体。当今许多企业的数据库或数据仓库中都搜集和存储了大量关于客户的宝贵数据,这些数据涵盖了从客户基本数据、购买记录及客户反馈的个个环节。充分利用这些数据,深入分析、挖掘隐含在这些数据中的有用信息,将有助于企业更好地管理客户关系,实现CRM的功能和目标。然而,由于缺乏在大量数据中发现深层次信息的能力,许多企业对于这些数据的利用还只是停留在基础层的浏览、检索、查询和应用层的继承、组合、整理等方面,而无法将这些数据转化为更加有用的知识。因此,如何更加有效地管理企业数据库中快速增长的海量数据,将数据资源的利用提高到知识创新的高级阶段,已经成为企业当前需要迫切解决的问题,数据挖掘(Data Mining简称DM)技术的运用就可以帮助企业很好地解决这个问题。
一、数据挖掘的流程
数据挖掘就是从大量的、不完全的、有噪声的、模糊的、随机的实际应用数据中,提取隐含在其中的、人们事先不知道的、但又是潜在的和有用的信息和知识的过程,它可以按照企业既定的业务目标自动地从数据库中提取出用以辅助企业决策的相关模式。数据挖掘的流程图如下:
图1中各步骤(1)确定业务对象。清晰地定义出业务问题,认清数据挖掘的目的是数据挖掘的重要一步。挖掘的最后结构是不可预测的,但要探索的问题应是有预见的,为了数据挖掘而数据挖掘则带有一盲目性,是不会成功的。(2)数据准备。一是数据的选择。搜索所有与业务对象有关的内部和外部数据信息,并从中选择出适用于数据挖掘应用的数据。二是数据的预处理。研究数据的质量,为进一步的分析做准备。并确定将要进行的挖掘操作的类型。三是数据的转换。将数据转换成一个分析模型,这个分析模型是针对挖掘算法建立的。建立一个真正适合挖掘算法的分析模型是数据挖掘成功的关键。(3)数据挖掘。对所得到的经过转换的数据进行挖掘。除了完善从选择合适的挖掘算法外,其余一切工作都能自动地完成。(4)结果分析。解释并评估结果,其使用的分析方法一般应作数据挖掘操作而定,通常会用到可视化技术。(5)知识的同化。将分析所得到的知识集成到业务信息系统的组织结构中去。
二、数据挖掘流程的模型
数据挖掘业内,公认的两大模型是SAS的SEMMA和包括SPSS在内的行业协会提出的CRISP-DM。SEMMA强调的是应用的方法;CRISP-DM则从方法学的角度强调实施数据挖掘项目的方法和步骤。CRISP-DM是站在高处,在讲一个总体大方向;而SEMMA在说具体应该如何着手。
1.SEMMA。(1)Sample──数据取样。当进行数据挖掘时,首先要从企业大量数据中取出一个与企业要探索问题相关的样板数据子集。通过数据取样,要把好数据的质量关,一定要保证取样数据的代表性、真实性、完整性和有效性,这样才能通过此后的分析研究得出反映本质规律性的结果。根据具体的需求,可以创建训练集、测试集和效验集。(2)Explore──数据特征探索、分析和预处理。当用户拿到了一个样本数据集后,它是否达到用户原来设想的要求,有没有什么明显的规律和趋势,有没有出现用户所从未设想过的数据状态,各因素之间有什么相关性,可区分成怎样一些类别,这些都是首先要探索的内容。(3)Modify──数据调整和技术选择。在问题进一步明确化的基础上,用户可以按照问题的具体要求来审视数据集,看它是否适应企业问题的需要。针对问题的需要,可能要对数据进行增删,也可能按照用户对整个数据挖掘过程的新认识,组合或者生成一些新的变量,以体现对状态的有效描述。(4)Model──模型的研发和知识的发现。数理统计方法是数据挖掘工作中最常用的主流技术手段。应用SAS提供的多种分析工具不仅能揭示企业已有数据间的新关系、隐藏着的规律性,而且能预测事件的发展趋势。用户采用哪一种模型,主要取决于数据集的特征和用户要实现的目标。另一方面,数据挖掘是一个反复的不断深化的实践过程,用户可在实践中选出最适合的模型。(5)Assess──模型和知识的综合解释和评价。经过以上五个步骤,用户将会得出一系列的分析结果、模式或模型,常常是对目标问题多侧面的描述。这时,就要能很好地综合这些规律性,为企业提供合理的决策支持信息。
2.CRISP-DM。(1)业务理解(Business Understanding)。最初的阶段集中在理解项目目标和从业务的角度理解需求,同时将这个知识转化为数据挖掘问题的定义和完成目标的初步计划。(2)数据理解(Data Understanding)。数据理解阶段从初始的数据收集开始,通过一些活动的处理,目的是熟悉数据,识别数据的质量问题,首次发现数据的内部属性,或是探测引起兴趣的子集去形成隐含信息的假设。(3)数据准备(Data
Preparation)。数据准备阶段包括从未处理数据中构造最终数据集的所有活动。这些数据将是模型工具的输入值。这个阶段的任务有个能执行多次,没有任何规定的顺序。任务包括表、记录和属性的选择,以及为模型工具转换和清洗数据。(4)建模(Modeling)。在这个阶段,可以选择和应用不同的模型技术,模型参数被调整到最佳的数值。一般,有些技术可以解决一类相同的数据挖掘问题。有些技术在数据形成上有特殊要求,因此需要经常跳回到数据准备阶段。(5)评估(Evaluation)。在开始最后部署模型之前,重要的事情是彻底地评估模型,检查构造模型的步骤,确保模型可以完成业务目标。此阶段的关键目的是确定是否有重要业务问题没有被充分的考虑。在这个阶段结束后,一个数据挖掘结果使用的决定必须达成。(6)部署(Deployment)。通常,模型的创建不是项目的结束。模型的作用是从数据中找到知识,获得的知识需要便于用户使用的方式重新组织和展现。根据需求,这个阶段可以产生简单的报告,或实现一个比较复杂的、可重复的数据挖掘过程。
参考文献
[1]Margaret H.Dunham.数据挖掘教程[M].清华大学出版社,2005
[2]魏兵.数据挖掘技术在客户关系管理中的应用研究[D].南京理工大学硕士.2005
[3]章兢,张小刚.数据挖掘算法及其工程应用[M].机械工业出版社,2006(6):56~73
[4]赵闪.数据挖掘在客户关系管理中的应用研究[D].广东工业大学硕士学位论文.2007
[5]邵兵家,于同奎.客户关系管理一理论与实践[M].清华大学出版社,2004
[6]贾月娥.客户关系管理趋势谈[J].管理信息化.2003
[7]马刚,李洪心,杨兴凯.客户关系管理[M].东北财经大学出版社,2005
项目课题:本文系佳木斯大学大学生科技创新项目课题,课题编码:Dz2011-097。
【关键词】客户关系管理;数据挖掘;流程;模型
随着市场经济的发展,企业将面临强大的竞争压力,企业的产品越来越趋向于同质化,仅仅依靠产品本身很难在日趋激烈的竞争中取胜,所以愈来愈多的先进企业将重点从以产品为中心向以客户为中心的新型商业模式转移,客户关系管理(CRM)也就应运而生。客户关系管理(Customer Relationship Management)简称CRM,是由美国的Gartner Group me公司于1999年首先提出的。CRM是一种以客户为中心的经营策略,它以信息技术为手段,并对工作流程进行重组,以赋予企业更完善的客户交流能力,最大化客户的收益率。CRM就是企业为了保持竞争力,采取的面向客户、客户驱动和以客户为中心的发展策略。而企业在与客户交互过程中积累下来的各种客户数据恰恰是反映客户特征和需求的最佳载体。当今许多企业的数据库或数据仓库中都搜集和存储了大量关于客户的宝贵数据,这些数据涵盖了从客户基本数据、购买记录及客户反馈的个个环节。充分利用这些数据,深入分析、挖掘隐含在这些数据中的有用信息,将有助于企业更好地管理客户关系,实现CRM的功能和目标。然而,由于缺乏在大量数据中发现深层次信息的能力,许多企业对于这些数据的利用还只是停留在基础层的浏览、检索、查询和应用层的继承、组合、整理等方面,而无法将这些数据转化为更加有用的知识。因此,如何更加有效地管理企业数据库中快速增长的海量数据,将数据资源的利用提高到知识创新的高级阶段,已经成为企业当前需要迫切解决的问题,数据挖掘(Data Mining简称DM)技术的运用就可以帮助企业很好地解决这个问题。
一、数据挖掘的流程
数据挖掘就是从大量的、不完全的、有噪声的、模糊的、随机的实际应用数据中,提取隐含在其中的、人们事先不知道的、但又是潜在的和有用的信息和知识的过程,它可以按照企业既定的业务目标自动地从数据库中提取出用以辅助企业决策的相关模式。数据挖掘的流程图如下:
图1中各步骤(1)确定业务对象。清晰地定义出业务问题,认清数据挖掘的目的是数据挖掘的重要一步。挖掘的最后结构是不可预测的,但要探索的问题应是有预见的,为了数据挖掘而数据挖掘则带有一盲目性,是不会成功的。(2)数据准备。一是数据的选择。搜索所有与业务对象有关的内部和外部数据信息,并从中选择出适用于数据挖掘应用的数据。二是数据的预处理。研究数据的质量,为进一步的分析做准备。并确定将要进行的挖掘操作的类型。三是数据的转换。将数据转换成一个分析模型,这个分析模型是针对挖掘算法建立的。建立一个真正适合挖掘算法的分析模型是数据挖掘成功的关键。(3)数据挖掘。对所得到的经过转换的数据进行挖掘。除了完善从选择合适的挖掘算法外,其余一切工作都能自动地完成。(4)结果分析。解释并评估结果,其使用的分析方法一般应作数据挖掘操作而定,通常会用到可视化技术。(5)知识的同化。将分析所得到的知识集成到业务信息系统的组织结构中去。
二、数据挖掘流程的模型
数据挖掘业内,公认的两大模型是SAS的SEMMA和包括SPSS在内的行业协会提出的CRISP-DM。SEMMA强调的是应用的方法;CRISP-DM则从方法学的角度强调实施数据挖掘项目的方法和步骤。CRISP-DM是站在高处,在讲一个总体大方向;而SEMMA在说具体应该如何着手。
1.SEMMA。(1)Sample──数据取样。当进行数据挖掘时,首先要从企业大量数据中取出一个与企业要探索问题相关的样板数据子集。通过数据取样,要把好数据的质量关,一定要保证取样数据的代表性、真实性、完整性和有效性,这样才能通过此后的分析研究得出反映本质规律性的结果。根据具体的需求,可以创建训练集、测试集和效验集。(2)Explore──数据特征探索、分析和预处理。当用户拿到了一个样本数据集后,它是否达到用户原来设想的要求,有没有什么明显的规律和趋势,有没有出现用户所从未设想过的数据状态,各因素之间有什么相关性,可区分成怎样一些类别,这些都是首先要探索的内容。(3)Modify──数据调整和技术选择。在问题进一步明确化的基础上,用户可以按照问题的具体要求来审视数据集,看它是否适应企业问题的需要。针对问题的需要,可能要对数据进行增删,也可能按照用户对整个数据挖掘过程的新认识,组合或者生成一些新的变量,以体现对状态的有效描述。(4)Model──模型的研发和知识的发现。数理统计方法是数据挖掘工作中最常用的主流技术手段。应用SAS提供的多种分析工具不仅能揭示企业已有数据间的新关系、隐藏着的规律性,而且能预测事件的发展趋势。用户采用哪一种模型,主要取决于数据集的特征和用户要实现的目标。另一方面,数据挖掘是一个反复的不断深化的实践过程,用户可在实践中选出最适合的模型。(5)Assess──模型和知识的综合解释和评价。经过以上五个步骤,用户将会得出一系列的分析结果、模式或模型,常常是对目标问题多侧面的描述。这时,就要能很好地综合这些规律性,为企业提供合理的决策支持信息。
2.CRISP-DM。(1)业务理解(Business Understanding)。最初的阶段集中在理解项目目标和从业务的角度理解需求,同时将这个知识转化为数据挖掘问题的定义和完成目标的初步计划。(2)数据理解(Data Understanding)。数据理解阶段从初始的数据收集开始,通过一些活动的处理,目的是熟悉数据,识别数据的质量问题,首次发现数据的内部属性,或是探测引起兴趣的子集去形成隐含信息的假设。(3)数据准备(Data
Preparation)。数据准备阶段包括从未处理数据中构造最终数据集的所有活动。这些数据将是模型工具的输入值。这个阶段的任务有个能执行多次,没有任何规定的顺序。任务包括表、记录和属性的选择,以及为模型工具转换和清洗数据。(4)建模(Modeling)。在这个阶段,可以选择和应用不同的模型技术,模型参数被调整到最佳的数值。一般,有些技术可以解决一类相同的数据挖掘问题。有些技术在数据形成上有特殊要求,因此需要经常跳回到数据准备阶段。(5)评估(Evaluation)。在开始最后部署模型之前,重要的事情是彻底地评估模型,检查构造模型的步骤,确保模型可以完成业务目标。此阶段的关键目的是确定是否有重要业务问题没有被充分的考虑。在这个阶段结束后,一个数据挖掘结果使用的决定必须达成。(6)部署(Deployment)。通常,模型的创建不是项目的结束。模型的作用是从数据中找到知识,获得的知识需要便于用户使用的方式重新组织和展现。根据需求,这个阶段可以产生简单的报告,或实现一个比较复杂的、可重复的数据挖掘过程。
参考文献
[1]Margaret H.Dunham.数据挖掘教程[M].清华大学出版社,2005
[2]魏兵.数据挖掘技术在客户关系管理中的应用研究[D].南京理工大学硕士.2005
[3]章兢,张小刚.数据挖掘算法及其工程应用[M].机械工业出版社,2006(6):56~73
[4]赵闪.数据挖掘在客户关系管理中的应用研究[D].广东工业大学硕士学位论文.2007
[5]邵兵家,于同奎.客户关系管理一理论与实践[M].清华大学出版社,2004
[6]贾月娥.客户关系管理趋势谈[J].管理信息化.2003
[7]马刚,李洪心,杨兴凯.客户关系管理[M].东北财经大学出版社,2005
项目课题:本文系佳木斯大学大学生科技创新项目课题,课题编码:Dz2011-097。