特征提取算法在KNN中的比较

来源 :赤峰学院学报:自然科学版 | 被引量 : 0次 | 上传用户:szweixian
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
文本自动分类技术是自然语言处理的一个重要的应用领域,是替代传统的繁杂人工分类方法的有效手段和必然趋势.本文简要介绍了文本分类的特征提取算法,并通过实验比较了各种提取算法在KNN中的性能.实验表明IG、MI、CE、χ2、WE五种特征提取方法在KNN分类器中性能接近,互信息(MI)特征提取方法随着特征数的提高分类性能提高地较快,当特征数目较小的时候分类性能极差.
其他文献
何为“马太效应”“马太效应”是最常见的一种社会惯性。其典故出自基督教《圣经》,在《新约·马太福音》第25章中有这样一个故事:主人要出国,把3个仆人叫来,把家业交给他们。按
古寺极乐访济平□葛秀邵国兴郭朝歌济平法师是极乐寺现任住持。初春一日,我们来到座落于江油武都镇观雾山腰的极乐寺,拜见这位爱国爱家、扶贫济困的济平法师。由于临近农历2月19日
本文从描述货物运输普遍性的思路上,利用项目集成策略,研究了低碳物流运作理论与策略,方案中表明规划的统筹性与物流监控行为是普及低碳物流运作的主要保证,证实了在地摊物流