劣质数据上代价敏感决策树的建立

来源 :软件学报 | 被引量 : 0次 | 上传用户:wyzxfjjx
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
代价敏感决策树是以最小化误分类代价和测试代价为目标的一种决策树.目前,随着数据量急剧增长,劣质数据的出现也愈发频繁.在建立代价敏感决策树时,训练数据集中的劣质数据会对分裂属性的选择和决策树结点的划分造成一定的影响.因此在进行分类任务前,需要提前对数据进行劣质数据清洗.然而在实际应用中,由于数据清洗工作所需要的时间和金钱代价往往很高,许多用户给出了自己可接受的数据清洗代价最大值,并要求将数据清洗的代价控制在这一阈值内.因此除了误分类代价和测试代价以外,劣质数据的清洗代价也是代价敏感决策树建立过程中的一个重要
其他文献
本文简述建筑抹灰工程常见质量问题产生原因及质量控制技术措施.
本文对建筑施工企业如何在工程施工阶段进行成本控制,进行阐述、分析,同时提出成本管理是项目施工管理的核心内容,并从若干方面入手来控制施工项目成本.
目的:千金子美白祛痘霜的制备并进行了临床疗效观察。方法以千金二萜醇二乙酸酯苯甲酸酯为主成分,采用霜剂配制方法制成的千金子美白祛痘霜,用于治疗临床黄褐斑、雀斑等患者,