论文部分内容阅读
近年来,随着客户对个性化消费要求的提高,企业为了获得竞争优势,已将客户的个性化需求摆在十分重要的位置上。客户的个性化需求离不开对客户行为数据的聚类分析,但是企业的客户数据类型复杂、数量巨大,在进行个性化聚类挖掘时面临着数据挖掘方法和数据挖掘平台选择的多重困难,所以企业对于客户行为数据挖掘方法和平台难题的解决已经迫在眉睫。因此,本文以新一站电商保险平台为切入点,着重解决新一站平台在对客户进行聚类时遇到的挖掘算法和平台的难题,为新一站保险平台的客户个性化服务提供基础,最终能够在市场竞争中获得优势。 为了解决新一站客户行为数据的挖掘过程中遇到的难题,本文首先分析总结了目前大数据、数据挖掘、聚类和客户行为的研究现状,并以此为基础总结了目前通用的研究方法,为研究分析打下了坚实的理论基础。之后,为了进一步分析新一站平台客户行为的背景,具体分析了新一站平台的框架结构、购物流程、客服流程、客户行为、以及客户特征等多方面,对接下来新一站客户聚类挖掘有着重要的作用。 在总结和分析了现有聚类研究的基础上,本文根据新一站客户数据的特点,选择了K-means作为聚类分析的基础,通过改进人工蜂群算法中的初始化过程、选择策略、领域调整策略以及新解生成机制,改善了原先人工蜂群算法的存在的不足,并利用改进之后盼算法与K-means相结合为K-ABC算法,从而弥补K-means算法存在的依赖初始值等缺陷,提高了算法的有效性和可靠性。根据选择算法的特点以及目前数据处理平台的比较,选择了Hadoop作为数据处理平台,并进行了聚类方法的并行化部署。最后本文通过新一站客户数据,在Hadoop平台上进行了实验,证明了融合后聚类算法K-ABC的有效性,并成功的实现了对新一站客户的聚类。 本文改进了经典人工蜂群算法中的初始化过程、选择策略、领域调整策略以及新解生成机制,提高了人工蜂群算法效率性和鲁棒性;并利用改良后的人工蜂群算法与K-means相结合,弥补了单独使用K-means算法的缺陷。本文的研究为众多企业利用客户行为数据进行客户聚类挖掘提供了一定的技术层面的支撑。