支持向量机不平衡问题和增量问题算法研究

被引量 : 0次 | 上传用户:wangliyong6666
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
支持向量机是建立在统计学习理论基础上的新型机器学习方法,该方法克服了其它机器算法中存在的局部最小解和过学习问题,有效地提高了算法的推广能力。由于其完备的理论基础和良好的实验结果,支持向量机在指纹识别、人脸识别、自动控制设备的故障检测等方面有着广泛的应用。然而,支持向量机作为机器学习领域中相对比较新的理论,它还有很多方面尚不成熟,需进一步研究和改进。本文综述了支持向量机的研究现状,针对目前支持向量机处理不平衡数据时,分类精度低以及处理大规模数据时的“瓶颈”问题,分别就支持向量机的不平衡调整以及增量学习方面进行了研究,主要内容如下:研究了不平衡向量机的算法调整方法。本文针对不平衡数据和噪声点对分类精度影响的问题,在模糊支持向量机的思想基础上,结合不平衡数据的影响因素,重新设计了模糊支持向量机的隶属度函数,提出了一种改进的模糊支持向量机。该方法提高了支持向量机的预测分类精度,平衡了错分率。研究了不平衡向量机的欠采样方法。本文针对传统欠采样中存在的边界样本处理策略过于简单、约减样本有限等问题,提出了一种改进的欠采样方法。该欠采样方法利用多类样本同分类超平面的距离将多类样本集分类,然后使用不同的采样率对分类样本进行欠采样。该欠采样方法在不增加计算复杂度的前提下,有效地平衡了样本数据,提高了不平衡数据的分类精度。研究了支持向量机的增量学习方法。本文将传统的基于KKT条件的支持向量机增量学习算法与C均值理论相结合,提出了一种快速的支持向量机增量学习算法。该算法消除了历史数据和增量数据的冗余信息,提高了学习精度和学习效率。虽然本文在支持向量机的不平衡问题和增量学习问题上取得了一些进展,然而,其中涉及到的一些参数需要人工设定,这些都需要进一步的研究和讨论。
其他文献
<正>北京大学第三医院隶属于卫生部、北京大学的三级甲等综合医院,现有床位976张,平均日门急诊量5000余人次。作为中国奥委会“奥林匹克运动员伤病防治中心”以及北京2008年奥
<正>澜沧江—湄公河发源于中国青海省唐古拉山北侧,在中国境内流经青海省、西藏自治区和云南省,从云南省西双版纳傣族自治州勐腊县出境,再流经老挝、缅甸、泰国、柬埔寨、越
高校实施"青年马克思主义者培养工程"要深刻认识其意义,并在理念与定位、内容与原则、途径与方法上下功夫,以扎实推进该工程的实施,为党和国家的事业培养更多优秀人才。
目的 探讨胫骨平台骨折外科治疗的思路和手术方法的选择。方法 自 2 0 0 0年 6月~ 2 0 0 3年 9月共收治胫骨平台骨折2 0 7例 (陈旧性损伤不统计在内 ) ,男 12 9例 ,女 78例
目的探讨镁剂与苦碟子注射液对心脑血管疾病的临床治疗效果;方法根据心脑血管疾病患者不同患病类型,对两组患者采用针对性常规治疗,试验组患者在常规治疗的基础上加用镁剂与
分析知识型员工的内涵及特征,阐述知识型员工的激励应以需求为基点,提出通过构建学习型组织、促进知识型员工个体成长,引进多元化的价值要素分配,实施弹性工作制、设计富有挑
用过氧化物引发聚丙烯(PP)交联制备高熔体强度聚丙烯(HMSPP),研究了过氧化物的用量、反应温度、螺杆转速对HMSPP性能的影响。得到的HMSPP比普通PP的熔体强度提高约3倍。用所研制的
目的探讨喹硫平、阿立哌唑联合文拉法辛治疗难治性抑郁症(TRD)的效果。方法 60例TRD患者,随机分为观察组与对照组,各30例。对照组采用喹硫平联合文拉法辛治疗,观察组采用阿立
Key-value类型的数据库是一种非关系型的数据库,它有着广泛的应用领域。尤其是在大规模和高并发类型的应用场景下,以及处理大量非结构化内容信息时,key-value存储系统发挥了重要
对飞机用橡胶软管产生低压爆破失效后的断口形貌特征以及疲劳失效原因进行了综合分析研究,并提出了改进措施。