【摘 要】
:
支持向量机是Vapnik等人提出的一种新的机器学习方法,它基于统计学习理论,借助最优化方法来解决机器学习问题,体现了统计学习理论中的结构风险最小化思想。但是在实际应用中,
论文部分内容阅读
支持向量机是Vapnik等人提出的一种新的机器学习方法,它基于统计学习理论,借助最优化方法来解决机器学习问题,体现了统计学习理论中的结构风险最小化思想。但是在实际应用中,需要处理的往往是海量数据或不均衡的小样本数据,因此,如何提高支持向量机对复杂数据的处理能力,使支持向量机的应用范围更为广泛,成为目前的一个研究热点。本文针对这个问题,主要做了如下两个方面的工作:第一,针对分类问题中训练样本分布不均衡,部分类别训练样本个数非常少的问题,提出了一种基于高斯分布的虚拟样本生成方法。该方法依据高斯分布理论,使得生成的虚拟样本在合理性上得到了保障,此外该方法可以充分利用先验知识,适用于多种分类问题,因此适应性得到了增强。结合提出的虚拟样本生成方法,利用支持向量机算法对标准数据库UCI中的鸢尾属植物数据集(Iris data set )以及KDD CUP 99入侵检测数据集进行仿真实验,实验结果表明该方法能充分利用先验知识,生成足够多具有合理标签的虚拟样本,有效的提高分类精度。第二,针对海量数据支持向量机学习算法运行缓慢的问题,通过研究支持向量的分布特性,提出了一种改进基于向量投影的支持向量预选取方法。在线性可分情况下将基于向量投影的支持向量预选取方法中的中心向量改为由Fisher线性判别判别算法求得的最佳投影向量,在非线性可分情况下将基于向量投影的支持向量预选取方法中的特征空间近似中心向量改为特征空间中的真实中心向量。由于选择了更为合理的投影向量,因此在保障分类性能的前提下,该方法能够利用更为少量的边界向量来代替原始样本进行训练,大大减少了训练样本,提高了支持向量机的训练速度。文中给出的仿真实验结果也验证了该方法的有效性和可行性。
其他文献
课题以协同工作平台服务系统开发为背景,以工作流技术为指导,构造生产任务调度领域模型并优化其调度方法,旨在通过优化调度流程,从而提高调度的效率与资源利用率。同时结合面
随着网络化制造的迅速发展,制造企业间各信息系统需要更多的通信和交互,需要共享相关数据,共同合作来完成企业业务流程。而由于历史的及其他方面的原因,企业信息系统大部分是
随着专利文献类别和数量的迅速增长,专利管理系统急需解决快速文献分类及高效、高质的专利检索等问题。在传统的专利管理系统中,分类是系统的基本功能,也是影响系统性能的关
在特种电影的制作过程中,图像的畸变校正、拼接、融合一体化是一个重要部分。本文重点研究了一体化过程中的图像畸变校正部分。本文在总结已有的图像校正方法的基础上,提出了
超常介质是一种新型的人工合成材料,它具有许多自然材料所不具备的独特的电磁特性。随着超常介质从微波到红外甚至光波段的实现,对电磁学、材料学、光学、电子学、通信等学科
汉字作为一种世界上最古老,并唯一流传至今的形意文字,已有六千年历史了。作为我们日常使用的语言文字,其具有数量巨大,结构复杂,相似字多等特点,因此手写汉字识别体现了模式
随着计算机网络和数据库技术的发展,在企业信息化建设和管理的过程中,异构数据库的应用越来越广泛,于是人们就提出了共享分布在不同地理位置上的异构多数据库信息的要求。异
图像压缩算法一直以来都是一个非常热门的研究领域,经过多年的研究,已经有了很多成熟的图像压缩技术。在图像处理领域,小波变换对信号的时、频局域的分析能力很强,所以它一直
实时系统主要面向现实世界中与时间因素相关的应用需求,在工业控制、航空航天和军事设备等众多领域里有着广泛的应用。它所关注的不仅是计算结果在逻辑上的正确性,而且还有输
开发web应用系统需要解决很多复杂问题,因此我们需要借助于第三方的开发平台,比如Java EE,来降低开发成本。遵循Java EE规范的Java EE框架,为一些web应用中的常见的问题提供了解