基于软概率的分类器动态集成方法研究

来源 :重庆大学 | 被引量 : 0次 | 上传用户:Colo
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
集成学习通过训练多个学习器来解决同一个问题,其泛化能力和稳定性往往要优于单一的学习器,因此受到广泛的关注。分类器集成方法,集成学习的主要研究方向,被广泛应用于解决经济管理、工程管理、医学诊断等领域的分类问题,如个人信用评估、企业财务危机预警、系统故障检测、医学诊断等。一个有效的分类器集成方法,能够帮助金融机构预测客户的违约率,降低财务风险;能够帮助工程管理人员尽早发现故障,及时制定维修计划;能够帮助医护人员进行智能判断,尽快制定治疗方案。随着经济的发展、自然环境的变化和科学技术的进步,人们对分类器集成方法的泛化能力和稳定性要求越来越高。本文在全面介绍分类器集成选择方法、分类器动态集成选择、分类器动态加权集成方法研究现状的基础上,分析已有研究存在的局限性,结合D-S证据理论、模糊软集合、马尔科夫链、软概率等理论,提出相应的解决方案,有效提高分类器集成方法的分类性能。主要研究内容包括三个方面:第一,基于模糊软集合和D-S证据理论的分类器集成选择方法研究。随着大数据时代的到来,用于训练基分类器的样本量越来越大,学习算法的计算和存储开销越来越大,为分类器集成方法的构建带来沉重的计算负担。为了解决该问题,分类器集成选择方法提供了一个新视角。构建这类方法的关键是选择标准和选择或搜索方法的确定,而以往的研究往往基于分类器的多样性或分类精确度构建选择标准,很少有学者同时考虑这两个因素。而且仅仅采用一种方法来度量分类器之间的差异性,很难捕获基分类器的多样性;同时仅仅采用精确度也很难衡量一个分类器的整体分类性能。因此,本文同时考虑多种多样性和分类性能度量指标,结合模糊软集合和D-S证据理论,从多准则决策的角度构建选择标准。最后,基于16个二分类数据集,与6个对比模型的分类结果进行对比分析,验证了该方法的有效性和优越性。第二,基于马尔科夫链的分类器动态加权集成方法研究。分类器融合方法的选择与构建,也是该领域的研究重点之一,而已有的融合方法可以分为两类:固定集成器和可训练的集成器。然而,这些融合方法都是静态的,它们在对待测样本进行集成分类时采用相同的融合规则,这将极大地降低分类器集成方法的泛化能力,无法适应环境的动态变化和时代的发展。虽然有一些分类器动态集成选择方法被提出,但其采用的融合方法仍然没有考虑分类器分类性能的变化规律。为了解决该问题,本文将分类器基于序列样本的分类性能变化看作是一个随机过程,并采用马尔科夫链进行建模,提出基于马尔科夫链的分类器动态加权集成方法。基于17个数据集,通过和12个对比模型的分类结果进行比较,验证了该方法解决二分类问题的有效性和优越性,同时验证了该方法在信用评估领域能够有效地降低错误分类成本,从而降低了金融机构的风险。第三,基于软概率的分类器动态集成方法研究。已有的分类器动态集成选择方法,往往基于分类器在验证集中的分类性能对其选择,而忽略了分类器在测试集中的分类行为。而且,针对分类器的选择和融合两个步骤需要分别选择不同的方法完成,而没有一个完整的方法或理论同时完成该两个步骤。软概率独特的运算过程能够同时包含以上两个步骤,同时分类器对待测样本的分类行为能够影响到分类器的选择与融合。因此,本文提出了基本的基于软概率的分类器动态集成方法,并基于10个信用数据集,具体介绍了该方法的应用步骤,并验证了该方法能够有效地降低信用风险。同时,结合第三章和第四章的研究内容,提出最终的基于软概率的分类器动态集成方法,并基于17个数据集,通过和14个对比模型的分类结果进行比较,验证了该方法解决二分类问题的有效性和优越性。
其他文献
永磁同步电机具有体积小、重量轻、效率高、性能好等一系列优点。随着高性能永磁材料的发展与电机制造技术的进步,永磁同步电机在电气产品、交通运输、工业以及国防等领域得
长期以来,由于多种原因,我省农业基础设施脆弱,人均占有农业资源短缺。如何从资源节约型、环境友好型方面探索新路子是许多农业专家的一个重要课题。本文依据2000—2005年陕
现如今的数据中,越来越多的数据以数据流的形态存在,例如金融交易信息数据、网页浏览数据、气象监测数据、电商购物数据以及各类传感器探测数据等。在这庞大的数据流中,相当一部分数据因为数据源更新、环境噪音、数据复写或者冲突以及传输设备故障等原因导致数据的缺失,从而形成了所谓的不确定数据。现有的单一针对确定数据流或者不确定数据库的挖掘算法无法直接应用。因此,设计面向不确定数据流的高效频繁模式的挖掘算法就极为
为应对日益突出的燃油供求矛盾和环境污染问题,世界各国都把发展新能源汽车产业作为国家重大战略。近年来,随着我国经济社会的发展,我国也出台了一系列财税政策支持新能源汽
再保险源于原保险对风险转移的需求,在保险制度中扮演着重要的角色。经济全球化使各国的保险与再保险市场连为一体。再保险业发达国家的再保险主体在竞争中始终居于主导地位,
本文针对3-DOF并联机械腿控制问题,分别从系统动力学模型建立、机械腿末端轨迹规划以及轨迹跟踪控制三个方面展开探索和研究。由于并联机械腿具有的承载能力大、运动精度高、机构构型灵活等优点被逐步应用到足式机器人的机构设计中。但因其复杂的数学模型从而增大了控制难度,因此,针对3-DOF并联机械腿进行数学建模、轨迹规划以及控制策略的研究具有重要的理论价值和实际意义。本文主要工作如下:首先,在名义动力学模型
追续权是艺术家从作品的转售中分享利益的权利。截至2015年,全球已有81个国家创设了追续权制度,追续权正在发展成为一项全球性权利。追续权起源于1920年的法国,法国当时正处
研究目的:分组进行有氧运动和抗阻运动来干预原发性高血压患者,记录通过12周的运动干预训练后,受试人员的血压值、体重值、静态心率值、血脂值、动脉弹性功能等相关指标的变化。然后分析实验结果来讨论不同运动方式对于原发性高血压患者血压值所能产生的效果,增加有氧运动和抗阻运动对高血压患者血压值改善的研究范围,使更多的广大群众选择通过运动来改善自身身体情况。研究方法:招募2019年6月至2019年9月中前来河
改革开放40年来中国经济持续高速增长,伴随着经济结构的变化,继续以资本和要素投入推动经济增长的发展方式已经不可持续,同时考虑资源与环境约束的绿色全要素生产率增长成为推动绿色经济发展转型的关键。在经济新常态下研究绿色全要素生产率增长,对于当前注重高质量绿色经济发展的中国具有一定的现实意义。金融发展作为绿色全要素生产率增长的内生动力,与绿色全要素生产率增长的关系密不可分,考虑到当前中国金融发展水平整体
随着新中国的诞生,中国社会在政治、经济、文化等领域都有突飞猛进的发展,整个社会环境都在进步的同时,越来越多的女性登上政治舞台。妇女的参政意识和水平不断提高,妇女权利