一种面向客户细分的聚类算法框架的研究与实现

来源 :南京大学 | 被引量 : 0次 | 上传用户:yuwenhuaji11987
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
聚类是数据挖掘中一种非常重要的方法,在模式识别,图像处理和信息提取等领域有着重要的应用。每种聚类算法都有其特有的优势和适合的应用场合。同时,不同的应用有其不同的特点,这就需要研究算法在某个特殊场合下的应用。   本论文结合江苏号百前向客户数据挖掘项目,对面向客户细分的聚类问题进行了研究,针对此项目的特点提出了相适应的聚类算法框架--基于改进DBSCAN的增量聚类算法框架。论文的主要工作如下:   1.此算法框架选取改进的DBSCAN作为基础的聚类算法,使得算法具有DBSCAN的优势,同时效率较高。算法实施时,先分别在基础数据和新增数据上进行聚类,然后将两个聚类结果合并,形成最终结果。   2.算法中数据相似性的度量和簇中心的计算能应用于同时包含数值型属性和分类型属性,即复合属性的情况。   3.进行了增量聚类。由于不断有新数据进入,因此先在基础数据上进行聚类,然后在新增数据上进行聚类,最后再将两个聚类结果进行合并。在分别进行聚类的时候,使用基于代表对象的改进DBSCAN方法。在合并聚类的时候,仍然用代表对象代表每个簇,然后通过代表对象之间的联系来进行合并。   4.使用决策树对聚类进行特征描述,加强了用户对聚类结果的理解,更加有助于营销建议的提出和决策的实施。   最后,论文将提出的算法应用于江苏号百前向客户数据挖掘项目,使用sas和spss等工具,得到客户细分的聚类结果。  
其他文献
随着计算机技术的发展,数据流已经成为数据存在的一种常见形式,被广泛应用到金融、交通、军事等领域。研究人员设计开发了许多集中式数据流管理系统以及分布式数据流管理系统以
近几年来,随着Internet的飞速发展以及IP技术不断成熟,下一代网络NGN(Next Generation Network)和软交换技术为结合电话网和Internet提供了思路,而IP-PBX(PBX over IP)是该技
基于哼唱的歌曲检索系统是一个分析处理音频信号的系统。任何信号处理过程都难免受到噪声的干扰。用户输入歌曲检索系统的哼唱信号中夹杂的白噪声、有色噪声、脉冲噪声以及非
对物体材质的研究近年来成为真实感绘制的热门问题。真实世界的材质数字化不仅对真实感图像的合成十分重要,而且还有很多其它方面的应用,比如电子商务、数字图书馆、文化遗产等
随着Internet的飞速发展,Web服务已在人们生活中起着越来越重要的作用.与此同时,能够反应用户行为的Web信息数据也日渐丰富。网络日志作为Web数据的一种存储方式,由于其数据充分
随着软件产业的迅速发展,软件系统的功能和结构日益复杂,人们对于软件产品的质量要求也越来越高。最常用的程序质量问题检测的技术包括软件测试和形式化验证。两种方法各有优缺
地形渲染是虚拟现实技术中非常重要的一部分,也是计算机图形学一个热门的研究课题。它广泛应用于地理信息系统、战场仿真、飞行模拟、电子地图、地形漫游和游戏娱乐等方面。随
移动学习系统是一个新型的E-learning学习环境,利用移动技术随时随地的特性,为学习者提供更加便利的学习支持服务。在面向职业培训和在岗学习的移动学习系统中,学习资源是一种特
在计算机科学领域中,程序分析足一种自动化地分析计算机程序的行为的重要技术。程序分析技术主要应用于程序的优化和程序正确性验证两个方面。现代编译器常常会利用程序分析技
BPEL(业务流程执行语言)作为一种Web服务组装协议,是使用XML编写的用于描述Web服务静态组装结构的形式规约语言。为了使BPEL所描述的Web服务组装能够满足设计人员的设计初衷。人