非平衡数据极限学习机分类方法及其应用

来源 :中国矿业大学 | 被引量 : 0次 | 上传用户:fudxing
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
非平衡分类问题是当前数据挖掘和机器学习领域中一个重要的课题,目前该问题已经引起了越来越多的关注,对学术界和工业界来说都是一个相对较新的挑战。非平衡分类问题涉及在数据不足或者严重的类别分布偏差的情况下对数据进行分类。由于非平衡数据集固有的复杂特性,需要更多新的算法和工具,以实现将大量原始数据有效地转换为有用的信息和知识。极限学习机算法由于其优秀的性能和较快的计算效率,成为热门的分类方法。但不可否认的是,由于其简单的参数设置方法,它存在一些固有的缺陷。如何提高已有算法的分类性能,以及应对更多特定的非平衡分类的实际问题,是目前亟需解决的问题。本文在极限学习机算法的基础上,从算法层面研究非平衡分类问题。本文的主要研究工作如下:(1)针对极限学习机算法随机初始化参数导致的缺陷,提出了基于头脑风暴优化算法的改进加权极限学习机算法。该算法在加权极限学习机网络的基础之上,利用头脑风暴优化算法来优化其网络的隐含层参数,并用面向非平衡数据集的评价指标同时对多数类和少数类的分类情况进行评估,实验结果证明,该方法可以有效提高加权极限学习机对非平衡数据的分类精度,并且效果稳定。(2)针对极限学习机的网络结构,提出了一种变维度头脑风暴算法的自适应CCR-ELM算法。该算法不仅优化了隐含层参数以及折衷因子,同时对隐含层节点进行优化;由于隐含层参数的长度由隐含层节点数决定,优化过程中种群个体长度会发生变化,为此提出了一种变维度头脑风暴算法,利用它找到当前最优的CCR-ELM网络结构。实验证明所提算法性能稳定,且不受非平衡率影响。(3)针对已标记数据较少的非平衡分类问题,提出了一种迁移加权极限学习机算法。采用迁移学习策略以实现源域数据到目标域数据之间的知识迁移,并以少量未标记目标域数据为导向样本,构建新的分类器,实现对目标域中的非平衡数据进行分类。实验证明,所提算法与两个非平衡分类算法和两个迁移极限学习机算法相比,具有更好并且更稳定的分类性能,同时继承了极限学习机类算法的优点,具有较快的运算效率。将所提算法应用到煤矿皮带故障诊断问题中,验证了该算法在实际应用中的有效性。
其他文献
共轭聚合物半导体材料在光电、催化、气体吸附、医药等方面都有较为全面的研究。芴作为一种很重要的共轭环化合物,它有着良好的共轭结构,这方便电子传输和转移,在太阳能电池
2002年,为贯彻《公民道德建设实施纲要》,加强家庭美德建设,沈阳市在全市开展了大规模的“档案进家庭”活动.沈阳市家庭建档工作走过了从理论探索到具体实践、从总结规律到示
大肠癌是一种涉及许多相关基因的多因素多阶段的恶性肿瘤,实验表明染色体外存在抑癌因素,维持细胞的肿瘤特性需要线粒体DNA(mitochondria DNA,mtDNA)的参与。大肠肿瘤的mtDNA
本文主要研究了随机振动系统首次穿越损坏问题的近似求解方法。首先采用传统的数值解法研究基于首次穿越扩散过程模型的单分子键断裂问题,建立了单分子键的条件可靠性函数所
中国对美国的制造业产品出口状况是由中美之间的双边国际分工格局所决定的。本文在理论分析的基础上,通过PVAR模型讨论了中国工业品出口美国对美国制造业创新的影响。研究表
目的对中国鼠疫自然疫源地自然感染鼠疫菌的节肢动物及其分布进行整理。方珐根据已发表的资料,对中国鼠疫自然疫源地染疫媒介进行统计。同时,对某些蚤类在鼠疫传播中的媒介作用
以直流双闭环模型为基础,针对现行直流双闭环PID控制器参数整定与优化的困难,通过将人工蜂群算法引入直流双闭环调速系统,实现直流电机调速及其PID控制器参数的自整定,采用系
生物化学是生命科学、农林、医药等领域人才培养体系中一门重要的专业基础课。长期以来的应试教育,束缚了学生的创造力及自主学习的能力,且本课程内容较为抽象枯燥,因此需要
基于社会交换理论和社会人假说,探讨上下级关系对一线食品销售不道德亲组织行为(UPB)的影响及内在作用机制,采用《上下级关系量表》、《责任知觉量表》和《不道德亲组织行为
商业银行是我国金融体系重要组成部分,在我国经济运行和社会发展中发挥着不可或缺的作用。同时,随着全球经济一体化的不断深入和发展,我国金融市场正在形成一个多元化、开放