基于不平衡数据集的支持向量机模型与算法研究

来源 :南昌航空大学 | 被引量 : 2次 | 上传用户:net_goose
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
支持向量机(Support Vector Machine,SVM)是一种重要机器学习算法,它基于VC维和结构风险最小化等统计学习理论发展而来,具有坚实的理论基础和普遍的实用性。其通常在类别相对平衡的数据中能够呈现良好的分类效果。但实际应用中许多分类问题都呈现出高度不平衡特性,对于不平衡的分类问题,支持向量机往往不具有很好的分类性能。本文基于不平衡分类问题的研究背景,对支持向量机算法的原理及其对不平衡数据分类的缺陷进行分析。对现有针对不平衡分类典型的改进型支持向量机算法进行实验验证,详细分析其优点和缺点,并基于此提出一种改进的算法——概率优化代价敏感支持向量机(PCS-SVM)。论文的主要研究内容有:(1)对支持向量机算法作用于不平衡数据效果不佳的原因进行详细分析,并通过实验对所述原因进行验证;基于目前典型的不平衡数据采样方法和改进的支持向量机算法,通过实验验证其在不平衡数据分类上的有效性;并指出传统改进算法的不足之处。(2)基于现有的代价敏感支持向量机算法,引入样本分布概率密度函数(PDF),有效地调整优化问题中的惩罚参数,提出一种改进的支持向量机算法PCS-SVM。算法使用相似度矩阵和预定义的超参数对超平面附近的样本类别进行估算,进而有效调整分离超平面;结合不同改进算法的优点,提高了算法在不同数据特性上的适应性和鲁棒性。(3)利用16组实际不平衡数据集对PCS-SVM算法进行验证,比较PCS-SVM算法与目前典型SVM改进算法的分类性能,使用不同的评价指标对新算法和传统改进算法的预测效果进行评价;并利用T检验的方法进一步比较PCS-SVM算法与其他SVM改进算法,验证PCS-SVM算法的有效性。
其他文献
目的 :探讨在妇产科护理工作中应用细节护理的临床效果。方法 :对2013年6月~2014年1月期间我院妇产科收治的100例患者的临床资料进行回顾性研究。我们将这100例患者随机分为
我国对不动产物权实行统一登记制度。不动产物权的设立、变更、转让和消灭,经依法登记的发生效力,未经登记的不发生效力。$$   不动产物权登记制度及效力$$   所谓不
报纸
随着市场经济的发展,国有企业越来越多的参与到股权收购业务中。除了考虑经济效益因素外,由于国有企业的具有资产增值保值等特殊的国有资本监管规定,所以国有企业在合并、收
农业综合生产能力体现了一个国家或地区的农业总体实力,提高农业综合生产能力是农业现代化发展的一项重要战略任务。自20世纪以来,随着世界人口的快速增长,人类对土地、资源
目的比较ARIMA模型和GM(1,1)模型在我国淋病发病率预测中的效果,为完善我国淋病的监测和防制工作提供参考依据。方法收集2004年1月-2012年12月我国淋病的月发病率资料,用SPSS
重视女大学生的培养,造就适应社会形势、适应未来发展、适应现代化建设需要的跨世纪女性人才,是现代社会发展的必然要求。然而,受传统文化、社会角色以及女性自我认识等因素
培养高职学生养成良好的职业素养是高等职业教育的重要目标,亦是提高学生就业竞争力的关键。本文简述了职业素养的内涵及提升高职学生职业素养的重要性,明确了职业素养培养的
在企业的发展中,会计信息披露发挥着重要作用,尤其是上市公司。真实、准确、完整、及时地披露相关会计信息,对保障投资者权益、维护证券和资本市场稳定起到了积极作用。但当
目的 分析综合护理干预对小儿心律失常的效果。方法 选择我院2014年1月至2015年1月收治的心律失常患儿50例,将其随机分成实验组和对照组各25例,对照组患儿给予常规护理,实验
流动儿童从熟悉的家乡文化环境到陌生的异地环境中生活并接受教育,存在一定文化适应问题。而学校是他们现阶段主要的生活、学习与交流场所,学校幸福感直接关系到他们的生活幸