三支决策的二阶段分类方法研究

来源 :河南师范大学 | 被引量 : 1次 | 上传用户:xbh88
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
大数据时代,从海量的数据中发现并提取出有价值的、潜在的知识,已成为当今数据挖掘过程中的重要任务,建立高效的分类模型,进行信息的规范化处理,是数据挖掘过程中重要的研究方向之一。在对数据进行挖掘的过程中,分类是较为基础的分析手段。传统的分类模型通常追求更高的分类准确性,同时忽略错误分类成本,但在实际问题中,决策风险往往存在且不尽相同,人们在做出相应决策时普遍期望误分类风险最小。三支决策作为一种分类模型,通过引入最小风险代价,将暂时无法决策的对象划分到边界域中,这种分类思想符合人类认知规律且具有一定的误分类容忍机制。研究如何将三支决策方法应用到数据挖掘分类任务中,对当前大数据的处理和应用具有一定的实际意义。针对三支决策在分类任务中,边界域包含信息不足、难以进行有效的划分,本研究基于三支决策思想,设计了三支决策的二阶段分类相关模型和算法,进一步增强边界域数据的划分能力,并提高分类精度。主要研究内容如下:(1)针对三支决策分类任务中,边界域分类样本数目较少且信息缺失,导致分类精度不高的问题,提出一种基于二阶段的三支决策边界域分类模型TWD-TP。在第一阶段,考虑到误分类代价影响,通过贝叶斯规则构建三支决策中样本的条件概率,然后求解最优化损失函数得到所需阈值,并按照三支决策规则对数据集进行划分,划分过程基于最小风险Bayes决策理论,划分后的正域、负域中包含一定量的误分类数据。在第二阶段,通过类别标签索引分别将正域、负域中误分样本作为增量信息引入边界域,增加边界域中的分类信息,并对边界域进行重构,最后采用分类器对重构边界域进行分类验证。实验结果表明:提出的TWD-TP模型不仅能在三支决策分类中筛选出高误分类特性的样本,同时重构边界域中之前不能被正确划分的样本得到有效划分,分类精度进一步提高。(2)三支决策在分类过程中,由于边界域包含分类信息不足,致使分类器难以进行有效训练,针对该问题,提出一种基于三支决策的边界域Bagging集成方法。该方法分两个阶段完成,第一阶段,根据三支决策贝叶斯规则对数据集进行三支划分,得到正域、负域和边界域。第二阶段,通过对边界域样本自助采样,训练出数个具有一定分类能力的基学习器,然后采用Bagging方法对各个基学习器进行集成结合,在投票阶段,对各个基学习器进行概率加权,最后输出投票结果。实验结果表明,所提算法能对边界域样本进行有效划分,提升三支决策模型的分类准确度。
其他文献
国防科技工业作为国民经济中重要的组成部分,在与区域经济发展的结合上,如何充分的发挥国防科技工业的技术溢出效应,成为区域经济发展的又一个增长极。根据国防科技工业技术
中国经济进入新常态给各领域带来了新的发展机遇,也提出了更高要求。在此背景下,高等学历继续教育作为高等学历教育体系重要组成,如何通过有效开展创新创业教育以适应新常态
如今社会主义市场持续进步,人们生活水平也在不断提升,对于物质生活的要求也在不断增高,要想促进这个地区经济的发展和进步,政府会选择提高最低工作标准的方法。政府在落实这
本论文主要研究的目的是为我国现阶段“中欧式风格”居住小区环境景观设计提出了“中欧式”住区景观设计的原则、设计的手法及设计的详细要点。本文以围绕住区建设的发展现状
阅读是学生学习历史最为基础、常用的手段,提高初中生的历史阅读能力是新课改的要求;是历史学科教学和素质教育的要求;同时历史阅读能力的提升有利于学生自身全面和持久的发
陶行知教育理论中的"教学做合一",给教育工作带来了很多启示,在陶先生看来,教学不是一件事而是三件事。教与学之所以能统一就是统一在"做"上,只有在"做"中教的才是老师,在"做
现阶段,在人们生活水平提高的同时,其法制观念也不断增强,相应的我国的法制建设也迈出了新的台阶。近几年,火灾问题频繁发生,但其认定结果并不科学准确,尚存在很大的纰漏,尤
三支决策作为一种更加符合人类认知的粒计算方法,能合理有效地从不确定信息中抽取有用的知识。作为三支决策理论的起源及主要研究分支,基于决策理论粗糙集的三支决策模型已成为处理不确定信息的重要工具。然而,基于决策理论粗糙集的三支决策模型仍然存在很多值得进一步研究的问题。如,现有的研究在构建风险度量函数时几乎都忽略了等价类之间的差异信息。因此,本文深入地研究了基于决策理论粗糙集的三支决策模型及其改进模型,提
写字是一种实用技术,书法是一门具有个性情感和审美表达的艺术。书法教育在写字教学的基础上提出来,就应有书法艺术性的体现。不论是教学内容,还是教育功能;不论是教学方法,
近年来数学文化这一词的使用频率在不断增加,大家对“数学文化”的重视,体现了对数学人文价值的新认识以及数学观和数学课程观的新变化,这些都促使“数学文化”进入了广大研