基于集成学习的支持向量机学习方法研究

来源 :山西大学 | 被引量 : 3次 | 上传用户:SOMNUS1
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
支持向量机Support Vector Machine, SVM)是机器学习领域的有效工具,以其快捷的训练方法和良好的泛化性能受到人们的广泛关注,在函数估计、模式识别等方面取得令人欣慰的成果。然而随着信息技术的飞速发展,机器学习所面临的数据维数及规模越来越大,使支持向量机的性能和效率受到影响。此外,支持向量机的性能易受核函数及参数的影响,因此寻找高效稳定的核选择方法一直也是支持向量机研究的热点问题。集成学习(Ensemble Learning)是一种典型的多机器学习方法,具有较强的稳定性和良好的泛化能力。针对以上问题,本文将SVM与集成学习技术有效融合,在以下几个方面开展研究工作。(1)对集成学习的基本原理及经典算法进行系统介绍,分析集成学习的特点及将其用于支持向量机研究的优势。(2)将多种特征选择算法与Bagging相结合提出一种基于集成学习的SVM特征选择算法。该算法先采用Bagging方法产生多组训练子集,然后在每一子集上利用不同的特征选择算法分别选出相应的特征子集作为输入空间训练得到子SVM学习器。利用不同的特征选择算法有利于构造有较大差异性在的集成个体,提高系统性能,从而弥补最优特征子集选取困难的不足。UCI数据集上的实验结果表明本文提出的算法与基于单种特征选择算法的集成学习相比能进一步增加个体差异性并提高系统学习性能。(3)将聚类与Bagging相结合提出一种基于集成学习的SVM大规模数据处理算法,其基本思想是从大规模数据集中提取出小规模的样本作为子训练集进行SVM集成个体的构造。为保证所提取的样本中包含较多的信息,算法先对原始数据聚类然后从每一类中选取一定比例的样本。在真实的空气质量预测数据集及标准数据集上的实验均说明本算法的有效性。(4)提出一种基于SVM集成的核选择算法。利用不同的核函数及参数产生SVM集成个体,将核选择融合于集成学习当中,避免了传统支持向量机在处理实际问题中要先进行核选择的难题。本文利用集成学习对SVM的特征选择、大规模数据处理、核选择等三方面内容进行研究。本文取得的成果是对SVM学习方法研究的一种补充,也为SVM解决实际应用问题提供一种新模式。
其他文献
基于计算机网络传输的远程数字视频监控系统弥补了传统监控系统因专线布局而限制传输距离的不足,使监控主体与客体摆脱了地理位置的束缚,理论上可以相隔任意远的距离,只要通过计
现今标准领域成为一个热门话题,我国在标准领域起步较晚,所以我们要参考国际先进的标准技术信息研制情况从而制定有利于我国标准发展的政策。参考热点信息所具有的行业属性情况
树木的模拟是计算机图形学在林学可视化领域应用的前沿课题之一,树木的形态结构在其生长过程中起着重要的作用,在树几何建模的过程中,真实地模拟树木枝条的自然弯曲状态是一
近年来,伴随着互联网的快速发展,如何有效获取网络信息和互联网资源的增长之间的矛盾日益突出。通用搜索引擎简单的宽度优先或深度优先搜索策略,由于需要遍历网络中的所有资
随着计算机和互联网技术的迅速发展和普及,人们获得的信息日益丰富,如何从这些丰富的信息中快速、准确的获取有用的信息,如何从海量的文档中抽取出事件发展的趋势报告等变得越来
伴随着视频编解码和无线通信技术发展,在会议、办公、监控等有实时视频传输业务的环境中,迫切需要实现箱机分离,摆脱线缆束缚,有线变无线,提供高品质的视频画面,给工作和生活带来便
随着EAST实验深入进行,用实验人员对EAST数据采集控制系统提出了新的要求:多用户权限管理的需求,友好简洁的用户体验,针对性、实时性日志更新等。   本文设计并实现了B/S
学位
聚类分析是一种无监督的机器学习方法,能有效地组织文本信息,应用非常广泛,而大部分文本聚类算法都采用向量空间模型表示文本对象。因此,向量空间模型的问题也就成为文本聚类存在
集装箱是国际物流的主要运输装备,国际货运的90%通过集装箱运输来完成。由于传统集装箱自身不载有信息,在运输过程中,对集装箱的识别和流向只能依靠人工操作,大大影响了运输、装卸
PID控制是按偏差的比例(P-Proportional)、积分(I-Integral)和微分(D-Derivative)线性组合构成控制量,对被控对象进行控制。本文总结了温室温度控制系统的特点,以常见的温度控