K-最近邻的改进及其在文本分类中的应用

来源 :河南师范大学学报:自然科学版 | 被引量 : 0次 | 上传用户:gby603
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
采用K近邻算法(Knearest neighbors ,简称KNN)进行分类时,如果训练样本数量太大,那么搜索测试样本的K个最近邻时,算法的计算量很大.本文针对KNN的不足提出了一种改进方法.改进的KNN算法通过定义样本的延拓类和延拓能力,保留延拓能力强的样本作为它延拓类中其它训练样本的代表,来缩减训练样本数量,达到减少算法计算量的目的.实验证明,改进的KNN算法具有很好的性能.
其他文献
对普遍鵟消化系统的形态结构进行了观察研究,结果表明:普通鵟具有锋利的喙,利于撕裂食物;舌根表面具有尖端指向后方的栉状突,可防止食物的滑脱;嗉囊发达;小肠发达,而盲肠极度
南召宝天曼地区含有丰富的野生植物资源,有维管植物173科,878属,2 696种.按其经济用途,可分为12类:食用植物、药用植物、园林绿化与观赏植物、用材植物、纤维植物、淀粉植物
汇率的决定是个理论问题,应该理性地评估有关人民币汇率的各种观点;汇率调整又是货币政策的工具,其决定和操作也应是理性和主动的。全球经济失衡不仅表现为部分国家储蓄、消费、
近年来,受资金紧张、贷存比指标考核等压力的影响,商业银行高息揽储行为有重新抬头的态势。本文首先从内、外部两个层面剖析了商业银行高息揽存的产生原因,接着分析了商业银
10月22日,广发银行与中国东方资产管理公司在广州举行签约仪式,双方正式建立战略合作关系。根据协议,双方将在信用增级、资产管理、信用评级、资金融通、过桥融资、证券、信托、
12月6日,人民银行广州分行、广东银监局、广东省高级人民法院、广东省公安厅共同主办的“保障用卡安全维护消费权益”宣传月活动启动仪式在广州举行广东省陈云贤副省长,广州市
三款“福农”系列银联卡亮相广东。2011年5月10日,中国人民银行广州分行、中国银联广东分公司举行广东地区银联福农卡发卡启动仪式。中国人民银行广州分行罗伯川行长和李升高
对钾原子的低频调制激发进行了理论研究,用含时多态展开方法计算了处于微波场、静电场和低射频场中钾原子21 s和19 f两个Stark态的跃迁几率; 通过改变低射频场的相位,我们得
根据分子中基团的特性和连接性, 将基团贡献法和拓扑方法结合在一起, 发展了一种计算炔烃密度的新方法--基团键贡献法, 该方法具有基团贡献法适用范围广和拓扑方法计算结果准
基于离散对数的困难性,利用GOST数字签名算法提出一种新的完全有效的代理盲签名方案,该方案高效安全,在发送代理子密钥时需要安全的秘密通道.