基于改进K-means算法的客户行为聚类识别——以新一站大数据环境为例

来源 :南京工业大学 | 被引量 : 0次 | 上传用户:shichun
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,随着客户对个性化消费要求的提高,企业为了获得竞争优势,已将客户的个性化需求摆在十分重要的位置上。客户的个性化需求离不开对客户行为数据的聚类分析,但是企业的客户数据类型复杂、数量巨大,在进行个性化聚类挖掘时面临着数据挖掘方法和数据挖掘平台选择的多重困难,所以企业对于客户行为数据挖掘方法和平台难题的解决已经迫在眉睫。因此,本文以新一站电商保险平台为切入点,着重解决新一站平台在对客户进行聚类时遇到的挖掘算法和平台的难题,为新一站保险平台的客户个性化服务提供基础,最终能够在市场竞争中获得优势。  为了解决新一站客户行为数据的挖掘过程中遇到的难题,本文首先分析总结了目前大数据、数据挖掘、聚类和客户行为的研究现状,并以此为基础总结了目前通用的研究方法,为研究分析打下了坚实的理论基础。之后,为了进一步分析新一站平台客户行为的背景,具体分析了新一站平台的框架结构、购物流程、客服流程、客户行为、以及客户特征等多方面,对接下来新一站客户聚类挖掘有着重要的作用。  在总结和分析了现有聚类研究的基础上,本文根据新一站客户数据的特点,选择了K-means作为聚类分析的基础,通过改进人工蜂群算法中的初始化过程、选择策略、领域调整策略以及新解生成机制,改善了原先人工蜂群算法的存在的不足,并利用改进之后盼算法与K-means相结合为K-ABC算法,从而弥补K-means算法存在的依赖初始值等缺陷,提高了算法的有效性和可靠性。根据选择算法的特点以及目前数据处理平台的比较,选择了Hadoop作为数据处理平台,并进行了聚类方法的并行化部署。最后本文通过新一站客户数据,在Hadoop平台上进行了实验,证明了融合后聚类算法K-ABC的有效性,并成功的实现了对新一站客户的聚类。  本文改进了经典人工蜂群算法中的初始化过程、选择策略、领域调整策略以及新解生成机制,提高了人工蜂群算法效率性和鲁棒性;并利用改良后的人工蜂群算法与K-means相结合,弥补了单独使用K-means算法的缺陷。本文的研究为众多企业利用客户行为数据进行客户聚类挖掘提供了一定的技术层面的支撑。
其他文献
内容摘要:新课程改革最基本的思想是“以人为本”,就是“以人的发展为本”,而生命是“本中之本”。在新课改的背景下,“教学过程不是一种单纯的认识过程,而是生命意义的发生、创造与凝聚的过程,是生命力量的呈现与发展的过程,是主体对于生命内涵的体验过程。教学不只是传授知识的活动,而是一种生命活动,是生命的基本存在方式。”  关键词: 情景体验 独立思考 数学建模  中国分类号:G633.6  下面我简要谈一
当前,市场需求的多样性增加,产品越来越趋向于个性化定制。制造型企业需要不断提升自身生产管理水平,确保能够及时响应市场的动态变化。虚拟单元制造系统结合了传统单元生产方式
本文以抑郁症患者康复护理的研究现状与进展为基础,通过对现有国内文献资料进行检索、收藏、学习及整理,综述了抑郁症患者的院内康复护理、家庭康复护理、社区康复护理等模式
【摘要】AutoCAD课程,则是一门由制图理论和绘图技能结合并融为一体的综合应用课程,在中职建筑室内装饰设计课程中有着不可或缺的地位,更是中职学校中学生进行大多数专业学习的必修课之一。由于AutoCAD课程的使用性强、操作规范要求高,而学生个人学习能力参差不齐,传统的教学模式已在教学活动中日渐显示出其无法适应AutoCAD教学要求的局限性,这令其需要进行改革突破,寻求新的课程设计方法。  【关键词
房地产业自身具有的波及范围广、上下游产业关联性强、投融资巨大等特点使其在我国占据了国民经济的支柱性行业的地位,从而使得房地产市场的发展形势直接牵动着各级政府以及