基于信息增益和基尼不纯度的K近邻算法

来源 :计算机技术与发展 | 被引量 : 0次 | 上传用户:chezhenmen
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
传统K近邻算法忽略每个属性对分类的不同重要程度,将每个属性同等看待,在计算样本间距离时赋予每个属性相同的权重,影响样本分类的正确性。利用单一指标来确定属性重要性过于片面,无法全面反应属性对分类的重要程度。针对这一问题,利用信息增益和基尼不纯度的综合指标作为判断属性重要程度的指标,该综合指标越大,属性对分类的重要程度越高。并依据综合指标构造属性权重,计算样本间的加权距离进行分类。为验证该方法的有效性,分别基于UCI数据库中Iris数据集和Wine数据集对基于信息增益和基尼不纯度综合指标的加权K近邻算法进行仿
其他文献
经济发展的内原动力是技术发展,而技术的发展与应用离不开人这一基本要素,因此在农村经济发展过程汇总人力资源的开发从来都是中心内容。结合目前我国农村经济市场开发的良好
在基础配方乳液的基础上,添加驼乳乳清制备驼乳乳清保湿乳液。通过体外称量法,分别在温度30℃,湿度20%和温度25℃,湿度80%这2种条件下对不同梯度驼乳乳清添加量的产品进行水
燕软集团以燕山大学为依托,是一家以为社会各行业信息化建设提供全面解决方案为核心业务,集软件先进技术研究、大型应用软件开发、自主版权软件销售、计算机信息系统集成、IT
针对单反相机外壳在实际生产中废品率过高的问题,创建了单反相机外壳的三维实体模型和模流分析模型并对工厂原始方案进行了CAE分析。在没有改变模具结构的情况下,通过改变模
针对铝板热轧机组中事故液压剪的设计方案进行分析探讨,给出主要设计参数的计算和选取依据,提出同步机构的设计要点。
选取典型移民示范区宁夏永宁县闽宁镇为研究区域,采用参与式农村评估方法,在划分农户生计方式的基础上对不同生计方式农户的土地利用变化和土地利用效率进行研究。结果表明:不同
介绍了某水电厂安装TURAB纯机械过速保护装置的必要性,阐述了TURAB纯机械过速保护装置的工作原理及其安装要点、应用与维护情况,并指出当水轮机组转速持续上升而调速器调速失
私家庭院设计是一门跨学科的综合艺术,涵盖了建筑设计、景观设计、植物设计、美学设计等范畴。私家庭院是为生活而建造的,以彰显业主的独特品格、业主追求自然情趣为核心,私家庭
研究目的:揭示中国耕地资源利用的碳排放时空分异规律及其与农业经济增长之间的脱钩关系,以期为中国耕地资源低碳化利用政策的制定和推行提供参考。研究方法:IPCC碳排系数法,
谈谈印刷设备管理全国政协机关文印室曹岚在现代印刷企业管理中,印刷设备管理是不可缺少的重要环节。一个企业如果没有完好的设备,就不可能生产出过硬的产品。设备管理是保障生