面向不平衡数据集的分类算法研究及其在通信智能运营方面的应用

来源 :北京邮电大学 | 被引量 : 2次 | 上传用户:liwl11
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
移动互联网的发展促使通信运营商将原有的以网络为核心的通信运营模式改变为以客户体验为中心的新型价值模式,通过数据挖掘实现以客户体验管理为中心的通信智能运营已经成为一种必然的趋势。通信智能运营中的客户流失预警和终端精准营销是典型的不平衡数据分类问题,因此,面向不平衡数据集的分类算法研究及其在通信智能运营中的应用具有实用意义。本文针对不平衡数据集的分类算法进行研究,所做的主要研究工作包括以下方面:首先,为解决不平衡数据集的分类问题,提出了一种基于近邻样本分布和泊松分布的改进合成少数类过采样(SMOTE:Synthetic Minority Oversampling Technique)算法,针对 SMOTE 算法生成新样本时不考虑数据分布、生成新样本过程不可控、丢弃多数类信息的问题,在生成新样本的时候引进和数据分布有关的参数,对合成样本的偏离程度进行有效调节,仿真结果验证了所提算法的有效性;其次,针对k最近邻(kNN:k-Nearest Neighbor)分类算法的算法复杂度过高的问题,提出了一种基于预分类的kNN改进算法(kP:kNN algorithm based on Pre-classification),通过删除数据集中特征不明显的数据样本来减少算法时间复杂度,仿真结果验证了所提算法的有效性。最后,从通信智能运营实际应用的角度出发,针对客户流失数据和终端营销数据,采用基于近邻样本分布和泊松分布的改进SMOTE算法(SPDDN:SMOTE algorithm based on Poisson Distribution and the Distribution of Neighborhoods)和kP算法进行数据挖掘和分析,验证了上述所提算法的有效性,为通信智能运营中面向不平衡数据集的分类方法提供了有效的解决方案。
其他文献
目的调查某高校护理专业大学生手机使用状况并分析影响因素,为高校开展相关的教育、管理工作提供依据。方法采用问卷调查法,对河北省某高校护理学院在校的每个年级中均随机抽
ue*M#’#dkB4##8#”专利申请号:00109“7公开号:1278062申请日:00.06.23公开日:00.12.27申请人地址:(100084川C京市海淀区清华园申请人:清华大学发明人:隋森芳文摘:本发明属于生物技
阐述新形势下加强医学信息工程专业人才培养的意义及医学信息工程专业发展现状,分析存在的问题,提出可行对策,包括全面完善人才培养政策、重点加强师资队伍建设、切实推进实
伴随着城市化进程的加快与人们生活水平不断提升,对交通运输需求日益增加,同时也推动了公路工程建设规模的扩大。在实际高速公路建设过程中,相应的施工人员要确保公路具备良好的
<正>21世纪以来,世界各国都存在着种种危机,我国也不能独善其身,在经济转轨、社会转型的中国,正确处理和解决这些公共危机有利于维护我国的政治稳定和经济发展。这些公共事件
翻转课堂模式的实践与研究,逐渐成为高校教育领域研究的热点。通过访谈及问卷调查的形式,调查了高校文科生对翻转课堂接受程度,并就翻转课堂在高校的进展情况展开分析。研究
在现代学徒制的背景下,为了保证老年服务与管理专业学生专业技能得到应有的训练,通过文献和比较其他院校的做法,可以看出老年服务与管理专业实训基地建设应当包括老年护理实
综合地震和钻井资料,运用断层活动速率法研究兰聊断裂时空演化规律,并重点剖析同沉积期断裂活动对东濮-莘县凹陷地层厚度、空间展布及沉积体系发育的控制作用。研究表明:兰聊
目的:探讨阻塞性睡眠呼吸暂停低通气综合征(Obstructive sleep apnea hypopnea syndrome,OSAHS)对难治性高血压(resistant hypertension,RH)患者血压及左心室结构、功能的影响。
近日国家卫生健康委网站发布《国家卫生健康委办公厅关于进一步加强医疗机构护理工作的通知》(以下简称《通知》)。《通知》在第四部分“持续提高医疗机构护理服务质量”中提