一种基于小波变换特征提取的集成学习算法

来源 :河南大学 | 被引量 : 0次 | 上传用户:hansenhuang1983
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
国际权威T.G. Dietterich将集成学习列为机器学习四大研究方向之首。泛化能力是评价机器学习算法好坏的重要指标。集成学习通过某种策略组合分类算法,能够有效地提高算法的泛化能力。创建泛化能力强、差异大的基分类器是集成学习算法成功的关键。小波变换作为一种有效的特征提取方法,因其在时域和频域都具有良好的局部特性,近年来受到学者们的密切关注。设计出具有高泛化能力的集成学习算法,一直是集成学习研究的热点问题之一。论文在分析和学习经典集成算法的基础上,提出一种基于小波变换特征提取的集成学习算法,即Wavelet-Forests算法。该算法的主要思想是通过构造具有差异性的基分类器,提高集成学习算法的泛化能力。在构造基分类器时,Wavelet-Forests算法采用处理训练数据集和处理输入特征相结合的方法,将特征集随机划分为多个特征子集,根据每个划分的特征子集,选择一个非空类子集对应的数据子集,再对这些数据子集采用自助法生成新的数据子集。在新的数据子集上实施小波变换,得到每个数据子集对应的小波系数矩阵。整合小波系数矩阵,得到基分类器的训练数据集。在集成基分类器时,采用平均法计算每个类的权,返回具有最大权的类。为了验证Wavelet-Forests算法的可行性和有效性,论文使用数据挖掘领域公认的WEKA平台实现该算法。采用UCI数据库提供的标准数据集,将Wavelet-Forests算法与单个分类器J48,以及Bagging、AdaBoost和Random Forest等经典集成算法的性能进行比较,使用准确率和ROC曲线分析实验结果。实验结果表明,Wavelet-Forests集成学习算法具有较高的准确率,可以用来处理不平衡类问题。
其他文献
随着移动通信技术的发展,手机短信已成为人们生活中必不可少的通信方式之一。然而日益增多的垃圾短信给人们的生活带来很多不便。垃圾短信过滤问题已成为全球性的具有重大现
应用中许多图像不仅携带了大量的表象信息,还携带了大量的情感信息,然而目前的图像标注检索技术却大多忽略情感因素。如何有效表示和描述图像的情感,并且给予量化,进而在检索
分析了目前数据挖掘的常用技术,以及数据挖掘技术在CRM中的应用,深入研究了经典关联规则挖掘算法Apriori算法。Apriori算法的主要问题是常常会产生巨大数量的项集和规则,以至
在工程实践和科学研究中存在大量优化问题,而这些问题大多是带有约束条件,且有时优化目标不止一个。由于问题自身的复杂性,传统的优化方法已经难以独立解决。进化算法作为一种基
软件性能(Software Performance)是影响软件质量的重要指标之一,它属于软件的非功能属性。随着软件规模的扩大和软件复杂度的增加,越来越多的软件产品中存在性能问题。传统的
随着卫星通信测控技术、计算机网络技术的发展和用户需求的提高,对卫通站的监控管理提出了越来越高的要求。而国内卫通站监控管理的发展仍然停留在较低水平上,已明显落后于我
手写数字识别技术是一个非常典型的模式识别的问题,具有很大的应用价值和理论研究价值。其中,信函的自动分拣是其典型应用之一。   首先阐述了计算机识别手写数字的必要性,手
网络技术的迅猛发展及互联网的普及,使得人们越来越依赖于网络信息的交流与共享,从互联网上获取人物信息的需求也逐步提高,然而海量的网络数据使得人物信息表现为零乱、碎片
学位
随着传感器技术、数据处理技术以及无线通信技术等的迅猛发展,信息对人们越来越重要,得到信息的途径越来越多。无线传感器网络是新兴的一种网络方式,该网络技术发展很快,并且