聚类融合算法研究及其在电信中的应用

被引量 : 0次 | 上传用户:long520liang
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
聚类,作为数据挖掘技术研究的热点之一,受到了越来越多的关注。目前已有很多比较成熟的聚类算法,如K-means、K-medoids、BIRCH、CURE、DBSCAN、STING等。虽然其中有些算法已经得到广泛应用,但由于聚类分析算法对于数据集有诸多限制,所以很难找到适合的方法进行聚类分析。由此,聚类融合算法应运而生。2002年,聚类融合算法一经提出就得到广泛关注。实验证明,该方法能够得到比单一聚类算法更优的结果。但其自身并不成熟,仍存在许多问题,如关键参数设定、“软”“硬”聚类的融合、共识函数的设计及选择等。本文所做工作如下:1.本文在深入了解聚类融合算法的基础上,重点考察了利用K-means算法产生聚类成员的聚类融合算法中各成员的聚类个数与最终融合质量的关系,并提出了一种改进算法以提高聚类融合的精确度。首先,根据聚类成员之间存在差异度的思想,定义了一种差异度计算公式;其次,通过实验考察各个聚类成员的聚类个数与目标聚类个数的差值对融合结果的影响,制定了加权函数的计算公式。实验数据证明,改进算法在精确度方面优于原算法。2.电信中客户细分模型多用K-means算法来进行,但该方法在实际应用中存在许多问题:需要专业人员指定聚类个数并对结果做出经验判断、划分结果“过硬”等。本文将聚类融合改进算法引入客户细分中,以某市电信公司小灵通业务数据挖掘为背景,针对客户通话、短信等行为属性特征进行客户细分。过程中使用聚类融合改进算法,能够有效解决上述问题并得出合理的聚类结果,同时通过对Co-association矩阵的分析可以得到每个客户属于某一集群的概率,达到了“软化”划分结果的目的,使数据挖掘更智能化。
其他文献
本文在分析会员制营销概念的基础上,从培养客户忠诚度、建造CRM、建立有效的交叉销售三个方面,探讨了会员制营销对企业带来的战略影响,表明会员制营销作为一种模式与理念值得
目的分析医疗机构急性中毒病例的中毒种类、职业构成、原因、转归等特征。方法分析2009—2010年五省6家医院急性中毒病例基本信息,利用SPSS18.0进行统计学分析。结果急性中毒
<正>腹股沟疝的腹膜前修补术(preperitoneal approach repair of inguinal hernias)也称之为后进路修补(posterior approach repair)手术,是指手术进路经由腹直肌后(非传统术
在供应链质量管理中,对供应商的激励非常重要,没有有效的激励机制,就无法保证供应商产品质量的优质和稳定,也不可能维持良好的供应关系。针对供应链质量管理的特点,提出两种
本文主要通过对伊斯兰教的宗教与社会活动场所——清真寺之现象学诠释,展现出清真寺的独特的内在特质,并进一步揭示:它已成为穆斯林们生存的见证,从而构筑出有限空间的无限言
面对新疆少数民族群体艾滋病流行日趋严峻的形势,我们不禁要问,是什么导致在面临艾滋病的危险时少数民族成为易受害的群体呢?我们认为形成这些风险的原因是非常复杂的,它受到
低温多效蒸馏海水淡化系统由于具有操作温度低,避免或减缓了设备的腐蚀和结垢;预处理简单;系统操作弹性大;动力消耗小:热效率高;系统操作安全可靠;可利用电厂低品位的余热从
中国,是世界三大农业起源中心之一。早在远古时期,就有了农业文明的萌芽,“神农尝百草”的传说就是那段历史留下的印迹。在我国辽阔的土地上,已发现了成千上万处新石器时代原始农
连锁超市在我国已发展近30年了,在人们生活中扮演越来越重要的角色,正在以更快的速度迅猛发展。随着我国加入WTO和全球经济一体化,沃尔玛、家乐福等国外大型连锁超市纷纷进入