基于支持向量机和决策树的电信通信数据分析与应用

来源 :广东工业大学 | 被引量 : 6次 | 上传用户:zhl2707
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
现代通信技术的高速发展以及移动智能终端的普及,使得人们对电信业务质量的要求越来越高,电信运营商可以通过提升业务质量来赢得用户资源,业务的用户体验是制定高效提升业务质量策略的依据之一。获取用户体验的传统方式有用户满意度调查问卷、业务满意度打分、随机用户语音回访等,很难得到准确全面的用户感知。测量报告由基站控制器采集,其数据客观地反映了全网的无线环境,从微观角度反映了终端的“感受”。用统计方法分析测量报告得到的用户体验比较直观、简单且片面,更多的是一种表象;用数据挖掘方法应用于测量报告可以得到不可预知的用户体验,具有现实意义和应用价值。从测量报告中挖掘到用户通话的真实体验,根据用户体验定位影响因素,实时优化无线网络提升通话质量,反过来提升用户体验。本文将挖掘用户体验的问题转换成预测分类问题,使用支持向量机和决策树多分类方法来解决。支持向量机(SVM)是当今机器学习中解决分类问题的重要方法之一,基于统计学习理论、最优化算法和核方法,具有全局优化、泛化能力强、避免“维数灾难”等优点,其优势在于小样本、高维数据的模式识别。决策树(DT)是一种预测模型,代表的是对象属性与对象值之间的一种映射关系,具有易于理解和快速分类等优点。由于测量报告数据量大,使用单一的支持向量机多分类方法会存在训练时间长、分类精度低、预测速度慢等缺点,于是本文结合决策树的结构特点,构造了一种新的基于支持向量机和决策树的多分类方法。新方法首先将一个多分类问题分解为多个二分类问题,针对每个二分类问题使用支持向量机解决,然后根据相异度来决策参与本次SVM训练的正负两类,本次SVM训练结束后,正负类合并成新的类簇参与下一次相异度计算,迭代上述过程直到所有类合并成一个类簇。这种方法生成的分类器模型结构是一棵二叉决策树。本文立足于SVM的理论基础、分析了DT的结构特点,研究了基于支持向量机和决策树多分类方法在电信数据上的实现及应用。主要工作包括:首先,仔细分析了测量报告数据的数据特点,进行了详细的数据预处理,包括数据清理、数据归约、数据归一化,并根据接收信号电平和接收信号质量对测量报告数据进行了类别划分。然后,在研究过程中发现,基于支持向量机和决策树的多分类方法存在错误累积和局部最优解等问题,往往使分类准确率下降,分类效果变差。仔细分析了其产生错误累积原因后,提出了基于哈夫曼树的支持向量机多分类方法,该方法有效减少了错误累积的同时也避免了局部最优解。最后,使用测量报告数据集对普通的SVM多分类方法、基于偏态树的SVM多分类方法和基于哈夫曼树的SVM多分类方法分别进行了实验验证。实验结果表明,新的方法在分类速度和分类精度上较传统的支持向量机多分类方法优越。仔细分析实验结果后,针对不同的分类结果,提出了相应的网络优化方法。
其他文献
随着互联网技术的飞速发展,博客、社交网络、微博等平台的出现,使得人们在网络上发表个人观点变得更为方便快捷。如何从海量数据中提取出消费者、商家、政府等群体需要的信息
在计算机辅助几何设计及相关领域,数据插值是一个非常基本和重要的工具。众所周知,数据参数化是影响数据插值结果的重要因素。参数式Lagrange插值在选取等距采样点和均匀参数化
近年来,随着科技的发展,手持设备都配有蓝牙和WiFi直连通信模块,通过使用蓝牙和WiFi直连技术,手持设备可以无需通过因特网即可互相连接进而传输数据,这种连接方式可以减少因特网的
随着Internet在各个领域的应用越来越普及,应用种类及数量的迅速增长,人们急切需要一种可以在Internet上实现服务或应用的跨平台、独立及松耦合化的中介技术。此时,Web服务技术
随着各种先进技术在智能电网中的广泛应用,以及IEC61970标准为智能电网信息一体化建设提供了一系列的标准和规范。其化解了供电企业异构系统间信息共享的矛盾,解决了供电企业智能电网信息交互过程中的诸多实际困难,也方便了第三方应用程序并入电网平台。传统基于C/S(客户端/服务器)架构方式GIS(Geographic Information System)应用,在随着电网规模的不断扩大,它所固有的一些不
目前光网络正向全光、业务多样化的方向发展。同时,业务量的攀升、全球能源危机的出现,为通信网中能源的有效利用提出了挑战。全光网络中没有电再生设备,不能规避非理想设备和器
多核/众核网络化计算、低能耗绿色计算、高可信计算等计算模式的出现,对嵌入式实时系统带来了新的研究需求与挑战。随着嵌入式系统应用领域的不断深化和芯片集成度的日益提高
近年来,国内移动互联网强势发展,智能手机迅速普及,人类已经进入了移动互联网时代,利用移动终端接入互联网进行信息交互,演变成为信息时代的一种新的生活方式。2014年中国互联网络
近年来,嵌入式计算、无线通信网络和分布式信息处理等技术快速发展,各种新技术得到广泛应用;而现实的应用需求也为人们不断设计出新的技术规范提供了动力。ZigBee作为无线通信
几何造型是CAD系统的核心.参数曲线曲面一直以来都是描述几何形状的主要工具,其中,参数化和曲面拼接是CAD中曲线曲面造型的基础问题.作为本文的部分内容,我们研究了Bezier曲