基于聚类的KNN算法改进

来源 :电脑知识与技术 | 被引量 : 0次 | 上传用户:milai8
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
通过研究KNN算法,提出了一种利用训练集文本聚类结果改进KNN算法的方法,首先将训练集文本采用DBSCAN算法聚进行聚类,将训练集文本分为若干个簇,然后采用KNN算法对测试文档进行测试,最后用距离最近的n个簇中的若干训练集文本使用KNN算法对测试文本进行分类。实验表明,改进后的算法降低了计算量,提高了效率,同时对聚类结果有了一定的改进。
其他文献
近日,《福布斯》(Forbes)在上海隆重举办了“福布斯亚洲顶尖50强”颁奖典礼,台达电子集团再度蝉联2008“福布斯亚洲顶尖50强”企业。台达子公司中达电通总经理王其鑫先生出席颁奖
为提高矿用液压元件测试系统的测试精度,阐述了对数据采集卡进行校准的必要性,分析了测试系统结构及数据采集原理,针对测试系统中使用的USB4711A数据采集卡进行了内部自校准
现在,为什么有许多加工车间在考虑采用自动化生产呢?理由很多。对于某些加工车间来说,来自于低成本地区的压力在不断增加,迫使他们必须降低直接劳务成本。对于另一些车间来说,由于
6 月国际饲料价格除豆粉和苜蓿粉外,其他饲料价格下跌;畜产品除牛奶和羊肉价格下跌外,其他畜产品价格持续上涨。一、国际饲料市场苜蓿粉平均价格上涨,而其他饲料价格出现下跌
智能张压力测试系统是针对油田测井操作人员由于长期驻外,所用测井仪器需要带回总部计量校验,由于路途遥远,操作不便,且部分仪器超出有效期仍在使用,存在着安全隐患等问题.因
EDM模腔加工电极的几何形状非常复杂,其加工精度要求极高,这就对CNC编程人员提出了一个严峻的挑战。此外,由于电极采用小批量生产,因此缩短编程时间十分重要。
我国经济增长和产业方式的调整和转变,遇到了经济技术发展瓶颈期问题,这就要求需要培养和引进大批技能型人才。在这种大时代背景下,对人才素质教育和技能培训有了更高的要求,
K-近邻算法(K-nearest neighbor,KNN)是一种思路简单、易于掌握、分类效果显著的算法。决定K-近邻算法分类效果关键因素之一就是距离的度量,欧氏距离经常作为K-近邻算法中度量
以魔芋、卡拉胶、菊粉、聚葡萄糖为主要原料制得脂肪丁替代物,代替红肠中的脂肪丁,降低红肠中的脂肪含量,通过单因素和正交试验,以感官评分和质构特性为指标,确定脂肪丁替代