多类支持向量机算法的研究和改进

来源 :上海交通大学 | 被引量 : 0次 | 上传用户:wuhaha_123
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
支持向量机作为近十年来最为成功的机器学习方法,在很多应用领域取得了很好的成绩,包括文本分类,手写字符的识别,人脸识别等等。它和其他机器学习方法最大的不同在于,它遵循了统计学习理论中的一些要求,包括结构风险最小化。从理论上它的期望误差有一个上界。支持向量机非常成功,但美中不足的是它本质上是解决两类问题的,但实际生活中更多的还是多类问题。用支持向量机解决多类问题仍然需要很多研究工作。 现有的用支持向量机解决多类问题的手段主要有两种:一是把多类问题转换成为若干两类问题;二是构造真正意义上的多类支持向量机,即把所有数据一起考虑。本文对多类支持向量机的原理和实现方法进行了研究,并在此基础上对算法进行了改进。 在本文中我们提出了两种改进方案,分别针对多类支持向量机算法中不同的部分:惩罚因子C和子问题。前一种改进方案的主要的想法是考虑类与类之间的关系,比如类与类之间的距离,并把这种关系整合到原来的多类支持向量机中。后一种方案的主要想法是平衡多类支持向量机中的各个子问题,而不是仅仅把这些子问题相加然后求解。两种方案角度不同,但是都体现了考虑整体最优的思想。 提出改进算法后我们做了如下工作: 1) 首先转换这两种方案对应的最优化问题到它们的对偶形式,从而使用更为方便的数值算法来进行求解,并且我们在实现这两种方案的时候使用了适合大规模数据的算法,因此可以支持大规模的数据运行; 2) 接着通过实验对这两种方案的有效性进行了验证。实验结果显示我们提出的改进方案很有效。
其他文献
便携式MP3播放器、集成MP3功能的PDA、Smart phone等产品销量日益增加,市场潜力巨大。这充分说明,对于消费类电子产品而言,MP3播放功能已逐渐发展成为一种必需。因为MP3应用的广
无线传感器网络作为一个新技术有着广阔的应用前景。但是传感器网络中的传感器节点一般采用电池供电,可以使用的电量非常有限,而且对于有成千上万节点的无线传感器网络来说,电池
高血压疾病是一种在全球范围内都具有高发病率和高死亡率的疾病,目前是最常见的心脑血管疾病之一。20世纪90年代以来,高血压基因研究在世界范围内成为热点,其分子生物学研究
在基于属性的密码系统中每个用户由一个可描述的属性集表示,用户拥有属性集对应的密钥集,用户的认证不再需要证书。在单个授权中心系统中,存在着授权中心负担过重、计算效率低等
随着基于IPv6的下一代网络技术的不断发展,各国政府也日益重视。基于IPv6的下一代网络产业发展方兴未艾。对于中国,发展下一代互联网具有极其重要的战略意义。国家发改委等八
NAT和防火墙问题是SIP应用中需要解决的问题,NAT和防火墙会造成SIP寻址不成功或者通信不顺畅,解决这个问题的办法是NAT和防火墙穿越。目前NAT穿越的方法主要有两种:一种是通
数字证书所有者经常担心的问题是如何在使用证书的同时保护好证书上敏感的个人信息。数字证书中可能包含关于证书所有者的一些不愿公开的特征属性。目前最广泛使用的证书标准
下一代网络是一个能够提供包括语音、视频、图像和数据等多种业务在内的综合开放网络。以软交换技术为核心的下一代网络已经成为目前国内外网络界的研究热点之一。 软交换
随着科技的进步,科学研究与工程实践中出现的优化问题也变得越来越复杂,传统优化方法在解决这些问题时,存在计算复杂度过高的局限。因此,计算机科学家们提出了许多模拟物理现象,或
随着计算机和网络技术的快速发展以及应用程度的不断提高,计算机网络安全已成为经济发展的关键,同时也是国防安全的重要组成部分。对入侵和攻击行为的检测与防范,保障计算机系统