一种新的决策树分裂属性选择方法

来源 :计算机技术与发展 | 被引量 : 0次 | 上传用户:majunchigg
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
分类问题是数据挖掘和机器学习中的一个核心问题。为了得到最大程度的分类准确率,决策树分类过程中,非常关键的是结点分裂属性的选择。常见的分裂结点属性选择方法可以分为信息熵方法、GINI系数方法等。分析了目前常见的选择分裂属性方法——基于信息熵方法的优、缺点,提出了基于卡方检验的决策树分裂属性的选择方法,用真实例子和设置模拟实验说明了文中算法的优越性。实验结果显示文中算法在分类错误率方面好于以信息熵为基础的方法。
其他文献
蚁群算法是优化领域中新出现的一种仿生进化算法,基于蚁群算法的聚类算法已经在当前的数据挖掘研究中得到应用。文中针对早期蚁群聚类算法的缺点,提出动态调整的蚁群聚类算法,通
面向对象的代表语言JAVA日趋流行,它的应用范围也越来越广泛。在此背景下,文中针对JAVA在图形编辑领域中的应用从结构方面进行了探讨和研究,以接口的灵活运用为手段实现了结构的
介绍一种基于频域的指纹图像增强算法,提出了一种新的纹线方向场估计方法,并根据纹线频谱分布特点,将求取方向场仅限定在了一个较小的圆环区域内进行。提出了基于纹线频谱能量分布的指纹图像滤波算法,它通过计算块频谱图中纹线频谱能量分布范围的变化自适应地改变角度滤波器通带范围。实验对比结果表明,经该算法增强后的图像脊谷信息清晰,具有较好的纹线增强效果。
ART2神经网络是按照自适应谐振理论建立的一种自组织、无监督的人工神经网络。通过分析经典自适应谐振神经网络聚类过程,针对传统ART2神经网络模型对分类的不确定性和网络权值
粗糙集理论是一种新的软计算方法,已成为知识发现和属性约简算法领域的一个研究热点。但经典的粗糙集理论是建立在等价关系基础之上的。从粗糙集理论出发,在优势关系之上给出了
关联规则是数据挖掘的重要研究内容之一。传统的关联规则挖掘算法仅适于处理二元属性与分类属性。为更好地处理数量属性,提出了一种自适应的基于模糊概念的量化关联规则挖掘算
函数依赖对关系数据库和XML文档都是一种重要的语义表达。文中对XML文档中存在的函数依赖、部分函数依赖和传递函数依赖进行分析,对规范部分函数依赖提出XML第二范式,对规范部
软件体系结构的提出对软件重用机制和软件开发效率的提高具有非常重要的意义。软件体系结构的使用是提高软件开发质量、减少软件开销和促进软件生产率提高的最有效方法之一。
面向服务的架构在实施中遇到了诸多困难,如增加系统的复杂性、难以与原有IT资源整合等,针对这些问题,在研究实现SOA的基本策略的基础上,分析了SOA的柔性,提出了通用权限管理服务、
数码谜题是人工智能领域中的经典问题。结合低阶数码谜题求解的具体实现过程,分析了求解高阶数码谜题的存储机制设计、可解性判断、移动规则设计及搜索策略。与传统搜索算法相