论文部分内容阅读
客户细分指企业按照一定标准将客户分成不同的客户群体,同一个客户群体表现为具有相似的行为,如购物偏好等。客户细分有助于企业在市场竞争中制定最优的市场策略,针对不同目标客户采取顾客吸引、客户挽留等措施,以此维护与客户的关系进而获得最大利润。客户细分将客户属性分为一般属性和交易属性,基于一般属性的研究是为了针对不同状态的客户提供合适的产品或服务,称之为以客户状态为导向。一般属性比较直观且易于理解,但一般属性相似的客户不一定具有相同的购物行为;而以客户价值为导向的研究的关注点在当前价值高的客户群体。但是从客户挽留的角度,这些方法并不能确保客户与企业关系长久牢固。针对上述提到的客户细分研究方面存在的薄弱之处,本文基于客户交易属性并以客户喜好为导向作了客户细分方法和应用系统研究,主要工作包含以下3个方面:(1)针对交易数据特点,用客户的购买树表示客户的交易属性,购买树是以客户购买的商品集合构建的树型层次结构,通常情况下一棵购买树包含客户若干次消费所购买的商品,并以一种基于客户购买树的距离定义来度量客户相似度。(2)引入一种索引树结构CoverTree,并在其基础上实现了一种基于购买树距离的客户聚类分析方法,该方法首先将客户交易数据转换为购买树,然后对所有客户的购买树集合建立索引,并结合购买树距离计算客户密度以便找出密度大且相互间距离远的客户对象作为聚类的初始中心,最后将其余非初始中心对象分配到距离其最近的初始中心,聚类算法执行结束。(3)设计并开发了一套可视化交互式客户分析系统,用于从客户的交易数据中分析客户关系。该系统包括4个模块:数据预处理模块,作用是筛选用户想要分析哪些源数据,以及数据清洗和构建购买树集合;数据模型构建模块,作用是将购买树构建为CoverTree对购买树集合建立索引;数据分析模块,将客户划分为不同群体,完成聚类;数据可视化模块,作用是将聚类结果转化为易理解的包含更多信息的数据,以便在浏览器端以图形化方式呈现客户关系、客户购物情况。为验证可视化交互式客户分析系统的应用效果,本文对比了购买树距离和其它基于交易数据的距离定义方法;对比了其他常见聚类算法与本文聚类算法的有效性、时间复杂度,验证了本文的方法更适合大规模交易数据分析;通过使用交易数据集验证可视化交互式客户分析系统的有效性,分析结果表明该系统的输出结果具有一定实际意义,为可视化客户分析应用作了一定探索性工作。