【摘 要】
:
双重支持向量机(Twin Support Vector Machines,简称 TWSVM)在 2007 年由 Jayadeva等人最早提出,它的基本思想是对两类训练样本点分别构造一个分类超平面,使得每一个超平面与本类训练样本点尽可能的近,而与另一类训练样本点尽可能的远.新的训练样本点离哪个超平面近,就属于哪一类.相比于经典的支持向量机(Support Vector Machines,简称SVM)
论文部分内容阅读
双重支持向量机(Twin Support Vector Machines,简称 TWSVM)在 2007 年由 Jayadeva等人最早提出,它的基本思想是对两类训练样本点分别构造一个分类超平面,使得每一个超平面与本类训练样本点尽可能的近,而与另一类训练样本点尽可能的远.新的训练样本点离哪个超平面近,就属于哪一类.相比于经典的支持向量机(Support Vector Machines,简称SVM),TWSVM将一个规模较大的二次规划问题成功转变为两个规模较小的二次规划问题,这样就使训练时间大大减少,计算效率大约是SVM的四倍.由于TWSVM优秀的学习性能,使其成为了数据挖掘、机器学习领域的研究热点.对TWSVM进行了深入的学习和研究后,发现TWSVM无法降低噪声对最优分类面的影响;此外TWSVM最早是为二分类问题所设计的,缺少对多分类问题的处理能力,本文针对上述问题,主要做了如下工作:(1)研究了 SVM和TWSVM两种算法的原理,介绍了其主要推理过程,通过对比,证明TWSVM所具有的良好性能.(2)为了降低噪声或野点对TWSVM最优分类面的影响,提出了三种改进的双重支持向量机,通过人工数据以及多组UCI数据上的实验,验证了这三种改进的算法的有效性.(3)为了将TWSVM的良好的性能推广到多分类问题中去,本文通过构造合理的二叉树结构并结合改进的双重支持向量机提出了混合二叉树双重支持向量机,最后通过数值实验验证了它良好的分类性能.
其他文献
图像的超分辨率技术是计算机视觉领域的热门研究课题,其优点在于成本低,重建效果好,现在已经被广泛应用到医学图像、天文图像、监控图像等领域。近几年,深层卷积神经网络在图
近年来,人工智能和知识发现的发展迅速,计算机技术在各领域的应用日益增多。数据量剧增,并呈现高维度、多类别、结构复杂等特点,对这些数据进行处理和挖掘,从中获取有价值的知识具有重要的研究意义和应用价值。粗糙集理论作为一种有效处理和分析不完备和不确定性数据的数学工具,为数据挖掘的研究提供了良好的理论支撑。同时,代价敏感学习是数据挖掘领域中的十大具有挑战性问题之一,其主要目的是获得最小总代价的属性集合。因
脑机接口通过分析脑电信号来识别大脑的意图,并将它们转化为对外部设备的控制指令从而实现中枢神经系统与外部设备之间信息传递和控制的功能。脑机接口在医疗和工程领域都有
气象服务广泛地应用于社会的方方面面,地面气象观测资料的好坏直接影响气象服务的质量,而地面气象站是地面气象观测资料的主要来源之一。布局合理的地面气象站能够保证在一定
对于任何实际系统,由于存在着能量、物质和信息的交换,必然都存在时滞因素,这些因素影响了系统的动态特性。所以,时滞模型能够更加精准的描述自然与社会的各种工程和现象的动
企业是构成开发区的基本元素,开发区如何健康发展取决于企业的绿色发展,企业的经济发展、绿色发展、科技发展成为开发区可持续发展的重要基石。以往对于企业的评估中,企业经济发展作为评估企业的重中之重,然后系统分析企业经济总值、纳税值等情况,根据单一的经济数据决定企业在园区内的帮扶力度和去留等工作,然而企业的规模、发展都不是均一的,是随着社会因素的总体影响的,使用单一的帮扶企业政策既不能满足多数企业的需求,
目的:幽门螺杆菌可引起多种疾病,包括慢性胃炎、贫血及荨麻疹等,并可导致胃癌发生率升高。随着西医治法方法的不断完善,其取得了良好的根除率及疗效,但在症状改善方面并不佳,并且Hp可反复感染,抗生素耐药率的增加使其根除率越来越低。随着最新临床实践与研究的结果表明,“三/四联疗法”配合中成药、或中药汤剂等中医治疗,能改善临床症状、提高Hp的根除率、减少Hp耐药率、药物副作用及反复感染率等作用。为了改善幽门
邻苯二酚是重要的化工中间体,在化工、食品、制药等方面具有不可忽视的作用。然而,邻苯二酚的大量使用污染了环境、食品,并对人体造成极大伤害。因此,寻找合适的方法检测邻苯
近年来,随着科学技术的持续发展与生产技术的不断提高,用于智能手机显示的薄膜晶体管液晶显示器(Thin Film Transistor Liquid Crystal Display,TFT-LCD)得到了蓬勃发展。一
本文研究的主要内容是可靠性设施选址问题。首先论述了本文研究的背景及意义,国内和国外的研究现状,简述了本文的主要研究内容;然后介绍了设施选址问题的分类,包括p-中心问题、p-中位问题、无容量限制的设施选址问题、有容量限制的设施选址问题、可靠性设施选址问题等;接着介绍了遗传算法的定义,相关遗传术语的简单说明,并给出了遗传算法的一般步骤;随后给出了本文的主要研究工作。创新研究主要体现在三个方面。第一,对