论文部分内容阅读
随着电子商务的不断发展,电子商务网站上商品的数量日益增多,信息膨胀。这就导致了在电子商务的发展过程中,出现了两类难题:一方面,用户面对太多的商品不愿逐个浏览;另一方面,商家如何更好地满足消费者的个性需求,保留忠诚客户、挖掘潜在客户等问题成为电子商务企业客户关系管理的核心。目前各大网站在潜在客户挖掘上做的还不完善,如何更准确地挖掘潜在客户是亟待解决的问题。
本文总结了国内外潜在客户挖掘的研究现状,并根据现状提出了本文思路——基于行为特征的潜在客户发现模型研究。客户行为特征与客户类别的关系实质上是一个分类问题,粗糙集是新兴的分类工具,不需要提供所需处理问题之外的任何先验信息就可以对数据进行分析处理,从中发现隐含的知识,揭示潜在的规律。本文首先对客户行为数据进行预处理,主要包括数据清洗、用户识别、访问次数统计、购买次数统计、客户数据匹配、浏览后是否购买属性识别、冗余数据删除、研究对象选择等过程。为了增加潜在客户发现的准确性,减少其他类型客户的干扰,本文选择了只对某产品只购买过一次或浏览后未购买过的客户进行研究。其次本文研究了基于粗糙集的客户行为特征挖掘算法,该部分主要分为客户行为数据离散化、客户行为数据约简和客户行为特征提取三个步骤。客户行为数据离散化阶段,本文引入了基于信息熵的离散化算法,使得离散化后不改变系统相容性;客户行为数据约简阶段,本文在考虑到系统不相容性的基础上引入了基于决策熵的属性约简算法;客户行为规则提取阶段,本文采取基于置信度的规则生成算法,使得生成的规则更符合研究目的和具有现实意义,并且在分析客户行为数据的大样本性及不同类别客户数量的差异性的基础上提出了改进的行为规则提取算法。然后本文构建了基于行为特征的潜在客户发现模型。第一步设计获取数据的预处理过程,第二步将基于粗糙集的行为特征提取算法中得到的客户行为特征建立为一个行为特征库;第三步对需预测的客户行为数据进行预处理及离散化;第四步匹配预处理后的访问行为数据与行为特征库中的数据,识别其是否为潜在客户。
实验结果分析表明,本文研究的基于行为特征的潜在客户发现模型有效提高了潜在客户发现准确率。最后对本文的研究做了总结,分析了本文模型的不足之处,对今后的研究工作给予了展望。