面向KNN分类的遗传实例选择算法

来源 :计算机应用 | 被引量 : 0次 | 上传用户:wml889900
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对传统的实例选择算法会误删训练集中非噪声样本、算法效率低的不足,本文提出了一种遗传实例选择算法。该算法采用基于决策树和遗传算法的二阶段筛选机制,先使用决策树确定噪声样本存在的范围,再使用遗传算法在该范围内精确删除噪声样本,可有效地降低误删率并提高效率。采用基于最近邻规则的验证集选择策略,进一步提高了遗传算法实例选择的准确度。最后引进基于均方误差的分类精度惩罚函数来计算遗传算法中个体的适应度,提高有效性和稳定性。在20个数据集上,该方法相较于PRKNN、IFS-Co Co、KNN,在分类精度上的提升分别为0.07~26.9个百分点、0.03~11.8个百分点、0.2~12.64个百分点,在AUC和Kappa的上的提升分别为0.25~18.32个百分点、1.27~23.29个百分点、0.04~12.82个百分点。实验结果表明,该方法相较于当前实例选择算法在分类精度和分类效率上均具有优势。
其他文献
吸丝枪是一种以压缩空气为动力的流体机械,其空气流路直接影响到流体分布,从而影响到吸丝枪的性能。为了阐明喷嘴结构对吸丝枪性能的影响,设计制作了16种喷嘴,测定了其吸丝张力、
<正>Throughout world history there were both successful and unsuccessful experiences in the rise of major powers.To realize strategic rise,a political power mus
硼在现代工业中具有不可替代的作用,随着硼资源的不断开发,硼矿石资源日益枯竭,盐湖卤水中硼的提取逐渐成为人们的关注和研究热点.盐湖卤水提硼的方法主要有沉淀法、吸附法、
结合景观生态学原理,将城市基本生态控制线分解为基本农田控制线,河流与湿地控制线,林地控制线,山体控制线,海岸、沙滩控制线,针对每个景观生态要素控制线,通过定性、定量分
在结合自然山水的中国城市规划实践中.有一种依凭山地形胜构建城市局的规划方式,古人称之为“踞山”.另有“坐山”、”依山”、”傍山”、枕山”等记载。《说文》所释:”踞.蹲也”
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们羽 制作:陈恬’#陈川个美食 Back to yield
一、我国开征物业税的动因(一)我国现行房地产税制存在缺陷一般认为,我国现行对房地产的征税,主要存在以下弊端:一是征税范围有限,计税依据缺乏弹性,税率单一,房地脱节,已不
1月18日至20日,97岁高龄的当代著名书法家、学者、社会活动家、文物鉴藏家、台湾师范大学教授、台湾华侨大学客座教授、亚西亚神学研究院博士班教授陈大络先生应漳州圆山岱仙
期刊
利用分析方法研究了马氏环境中马氏链的若干强极限定理.得到了关于此种链四元函数的一个强极限定理.作为推论,得到了马氏环境中马氏链相对熵密度的几个极限性质,将Shannon定