基于属性纯度的决策树归纳算法

来源 :四川师范大学 | 被引量 : 1次 | 上传用户:rilson
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
决策树归纳算法具有基于信息熵的决策树归纳算法和基于粗糙集的决策树归纳算法两种模式.在粒化冲突导致特征选择失效时,基于粗糙集的决策树算法使用信息函数进行分裂节点选择,降低了模型的分类准确度.对此问题,本学位论文采用粒计算机制提出属性纯度来表征精确性刻画,并结合属性依赖度来构建决策树归纳算法.相关内容涉及如下四个方面.一、先定义条件粒关于决策类的纯度概念(即微观底层纯度).然后在条件粒关于各决策类的底层纯度中,选择具有最大统计值的结果,表示条件粒关于决策分类的纯度(即中观中层纯度).最后采用统计集成策略来建立属性纯度(即宏观高层纯度).高层属性纯度表征了决策分类对于条件分类的识别精确程度,能够用于属性评估与特征优选,即可作为决策树分裂属性选择的标准.从而三层纯度体系得以建立,并具有自底向上的层次集成关系.二、基于高层属性纯度的定量识别特性建立基于属性纯度的一阶段决策树归纳算法(即P算法).同时指出该算法存在收敛速度慢,生成的模型结构复杂等问题.剖析了属性纯度和属性依赖度对粒结构和决策分类隶属关系的表征差异,为合理构建后续二阶段算法奠定基础.三、分析信息增益率和属性依赖度的异质性,澄清属性纯度和属性依赖度的同质异态性.在基于属性纯度的一阶段决策树算法的基础上,结合属性依赖度建立“先属性依赖度定性后属性纯度定量”的二阶段决策树归纳算法(即DP算法).四、决策表实例分析与数据实验验证了信息增益率和属性依赖度的异质性、属性依赖度和属性纯度的同质异态性,并表明所提二阶段算法DP的有效性与改进性.总之,通过三层纯度的构建,最终得到一个关于分类准确性的定量度量――属性纯度,其被选为决策树构造中的属性重要性程度指标.再基于属性纯度和属性依赖度的同质异态性,这两种度量系统引入构建了二阶段决策树算法DP,其具有较高分类精度与更好识别能力.
其他文献
推进建筑产业化是我国的基本国策,是一项复杂的系统工程。其中,探索适合产业化的建筑体系是这项工程的基础。钢结构镶嵌ASA板建筑体系,是一种以工业固体废弃物为主要原料制作
本文就兴安盟玉米保护性耕作技术的发展现状做了详细介绍.分析指出了发展中存在的问题.阐述了进一步发展的个人观点.
<正>中药作为传统医药历经千百年的临床实践,为华夏子孙的生命健康做出巨大贡献。但由于长期以来人们存在"中药是天然的,具有安全、低毒甚至是无毒的特质"的片面认识,使有些
会议
城镇化是我国现代化建设的历史任务,是扩大内需和促进城乡一体化发展的重要途径。本文基于利益一行为——制度一激励的视角建立了城镇化发展的政治经济学分析框架,从这四个方面
标准编号NY/T1930—2010范围:本标准规定了秸秆颗粒饲料压制机产品质量评价指标、检验方法和检验规则。本标准适用于环模式秸秆颗粒饲料压制机产品质量评价。主要技术内容1.质量
随着经济的发展和科技的进步,石油公园景观的建设成为以石油开采为主的资源型工业城市再生发展过程中的重要内容,而土壤盐碱化是石油公园景观建设中的关键因子。如何将景观设
<正>期望落差(met expectations)是 IOB 领域的重要概念之一,指“个体在工作中的积极或消极体验与其期望的经历之间的差异”。未实现的期望会增加员工离职的可能性,即所谓的