论文部分内容阅读
传统决策树在对不平衡数据进行分类时,提高正类的权重和舍弃部分负类的信息,造成负类的预测精度较低。文章引入强化学习思想,提出一种基于马尔可夫决策过程的改进决策树方法。根据马尔可夫决策过程、当前分裂特征的标准化互信息和马修斯相关系数作为信息增益率的奖励或者惩罚,形成新的特征选择标准。实验结果表明,与其他传统方法相比,改进的马尔可夫决策树对非平衡数据整体的预测精度及负类预测精度均有提高。