论文部分内容阅读
在机器学习领域中,决策树是一个很重要的问题.决策树作为一种工具已经应用在了很多领域中.虽然对决策树的研究已经十分广泛,但是在决策树的分类算法中仍然存在一些不足之处,例如使用信息增益作为分类准则会造成“多值偏向”问题的出现.在决策树算法中,ID3算法就是一种基于信息增益的算法,它作为决策树的核心算法,可以扩展到其他决策树算法中去.为了优化决策树分类算法,这篇文章提出了一种对于ID3算法的新型决策树分类扩展算法,称为ID3-α.ID3-α引入一个特别的权值来平衡属性值对于数据的不平衡程度.实验表明这种新型的算法在分类问题上的表现要比ID3算法精确,并且这种加权思想也可以用在其他决策树算法中.