【摘 要】
:
分类问题是机器学习中研究的重要问题之一,它广泛地存在于语音识别,文本分类,疾病诊断等领域.数据的收集过程中,往往由于标签记错或数据有噪声而产生异常值.因为异常值会降低的分类模型性能,所以需要鲁棒的方法来解决这种问题.本文在增强模型鲁棒性的前提下,提出了解决二分类问题和多分类问题的方法,具体内容如下:第一,提出了一种解决二分类问题的方法,即基于Rescaled hinge损失函数的双支持向量机.其主
论文部分内容阅读
分类问题是机器学习中研究的重要问题之一,它广泛地存在于语音识别,文本分类,疾病诊断等领域.数据的收集过程中,往往由于标签记错或数据有噪声而产生异常值.因为异常值会降低的分类模型性能,所以需要鲁棒的方法来解决这种问题.本文在增强模型鲁棒性的前提下,提出了解决二分类问题和多分类问题的方法,具体内容如下:第一,提出了一种解决二分类问题的方法,即基于Rescaled hinge损失函数的双支持向量机.其主要思想是:通过Rescaled hinge损失函数和传统的双支持向量机结合,得到优化问题.实际上该方法是一个加权双支持向量机,给每个样本点不同的惩罚,增强了模型的鲁棒性.本文所提出的方法可以适用于更广泛的问题,它可以通过线性决策函数解决交叉形数据的问题.最后,本文的方法只需求解两个小规模的二次规划问题,计算复杂度相对较低.基于人工数据集和UCI数据集的实验表明,本文提的算法具有更好的鲁棒性.第二,提出了一种解决多分类问题的方法,即基于Rescaled hinge损失函数的多子支持向量机.它的主要思想是将Rescaled hinge损失函数与传统的多子支持向量机结合,得到基于Rescaled hinge损失函数的多子支持向量机.首先,实际上它是通过给每个样本点不同的惩罚而得到的,从而可识别数据集中的异常值,降低了异常值对模型的影响.其次,加权多子支持向量机只需求解K个小规模的二次规划问题,具有较低的计算复杂度.最后,Rescaled hinge损失函数的使用将优化问题变成了一个非凸的优化问题.本文采用共轭函数理论将问题等价变换,再用交替优化迭代算法求解.基于无噪声和有噪声的UCI数据集的实验表明,本文提出的基于Rescaled hinge损失函数的多子支持向量机是有效的,与现有的多分类算法相比,具有更高的分类精度.
其他文献
从20世纪50年代开始,台湾经历了 30多年的高速增长阶段,创造出经济起飞奇迹。80年代中后期,随着工业化加速阶段的结束以及进入服务业社会,台湾经济增长相应减缓。90年代开始,
目的:1.通过调查254例广州地区老年人的衰弱状况,分析老年人衰弱的生理、心理、认知等特点及其影响因素,为实现衰弱高危人群的早期识别及进一步衰弱的预防和干预措施提供依据;2.评价健脾养胃膏干预老年人衰弱的临床疗效及安全性。方法:1.254例广州地区老年人群的衰弱状况的研究:以广州地区254名60岁及以上老年人为研究对象,采用Fried衰弱表型(Frailty phenotype,FP)对老年人进行
城市轨道交通是当今比较便捷的交通出行方式,而地铁不但可以缓解交通拥堵而且还因其“便捷、绿色”的出行特点得到了政府的大力支持,并成为缓解交通拥堵的最佳方案。近年来全国各地政府部门纷纷出台政策,加大对地铁的投资建设以及其运营管理。随着地铁规划建设如火如荼的进行,地铁引起的一些问题也随之而来。由于地铁供电系统采用直流供电方式,地铁运行时的杂散电流会通过变压器中性点侵入变压器,引起变压器一系列电磁效应,如
全球经济高速发展,员工作为企业创新的主体,其创新行为受到企业包容性创新环境的影响。现有研究主要集中于员工个人特质、传统领导风格、企业创新氛围等对员工创新行为产生的影响上,而对领导者包容性的关注度并不高。基于社会交换理论、社会认知理论以及自我决定理论,本文重点研究了企业在职员工的创新行为,探究包容型领导对员工创新行为的作用,以及创新自我效能感的内驱力作用和工作自主性的调节作用,明确包容型领导对员工创
新的时代孕育出新的思想理论,新的时代为探讨民族进步提供新的历史空间,新时代中国特色社会主义民族理论对以往民族理论来说既是继承发展又是新飞跃。在马克思主义民族理论中“社会发展对民族进步影响”是民族发展论不可或缺的组成部分,党的十九大明确指出,我国正处在全面建设小康社会的决胜阶段,根据国家统计局数据显示,新疆地区的生产总值、居民人均可以支配收入、城镇建设、农林牧渔业总产值、规模以上产业企业单位个数等均
汽车门内板是由冲压模具冲压而成的薄板冲压件,属于车身主要的板料覆盖件,结构尺寸大,外形几何形状复杂,成形拉深较深,制件表面质量要求较高,拉深过程很容易出现拉深开裂、起皱、拉痕等问题,所以工艺水平高低会影响到后期汽车整体质量,板料成形过程中的主参数设置不能简单依靠经验选择,必须在考虑材料的力学性能之外,对冲压成形工艺主参数进行优化设计。运用CAE有限元模拟技术就能够对板料冲压成形工艺过程进行数值模拟
纺织印染行业是我国主要工业之一,但其产生的印染废水产量大(2018年排放约19亿吨),排放量居全国工业行业第三位。在纺织染整工业中常会用到有机氯化合物或者产生部分有机氯化合物副产物,有机氯化物大多具有毒性或致癌性,对人类和生态环境造成危害。目前污染物控制目标主要为常规的废水排放指标,如COD、氨氮等,但其中含有的毒性和致癌性有机物仍没有成为控制目标。针对印染废水中有机氯化物的潜在污染危害,选取珠三
改革开放以来,建筑业在国民经济中占比越来越大,扮演着不可或缺的角色,创造了无数的就业机会。但是传统的现浇建造模式逐渐开始出现弊端,比如材料耗费严重、人工需求巨大、环境污染严重等问题逐渐暴露出来,迫于此种状况,传统现浇模式必须得到改革,于是,一种全新的装配式建造模式开始在社会上得到认可,装配式建筑有着建造工期短、环境污染小、资源耗费低等优点,符合如今人们对健康的追求理念,也得到了政府的大力支持。但是
航空发动机作为航空器的“心脏”,它的研制是航空产业的核心竞争环节。航空武器装备的关键部位—轴承,同样也承担着及其重要的角色,它不仅需要在高速、高温条件下工作,还同时承受各种应力和压力,其动态特性直接关系到发动机的性能和可靠性。由于航空发动机场合的特殊性,极小的摩擦也能引起较大的生热量,因此对某型航空发动机双列角接触球轴承特性分析显得尤为重要。本文以某型航空发动机双列角接触球轴承为研究对象,在滚动轴
十九大报告指出要谋民生之利,就业是民生之本,就业也是我国公民所享有的最基本的权利。残障人士就业是一个严峻的社会问题,2010年中国残障人士总数为8502万,智力障碍人数为568万,就业率仅有30.1%。山丹县C中心有残疾人93人,轻度智障青年占69%,智障人士就业率为27%。轻度智障人士属于残疾等级最低的群体,可塑性较强。该群体享受的残疾补贴最少,他们有强烈的就业需求,现如今有很多到了劳动年龄并且