改进的K-近邻算法在中文网页分类的应用

来源 :佳木斯大学学报:自然科学版 | 被引量 : 0次 | 上传用户:q43372958
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
K-邻近算法作为一种比较简单,易于实现并且错误低的分类算法,广泛应用于网页分类、模式识别和数据挖掘等多个领域中.本文介绍了传统K-邻近算法并分析了该算法在网页相似度值的计算存在的不足,在此基础上,本文提出了基于类中心向量的K-近邻算法,通过理论分析和仿真实验结果证明了该算法对于中文网页分类具有较好的分类效果.
其他文献
本文论述了对微小误差准则的理解,并着重联系实际工作所需阐述如何运用此取舍的准则.
本文介绍了大山选矿厂φ5.5×8.5m球磨机排料口中空轴衬部件焊接后的振动时效处理工艺,解决了残余应力消除的问题,取得了良好的效果.
主要讨论了食饵具有非线性密度制约带Holling-Π型功能反应项的捕食者—食饵扩散模型解的整体性态.先应用上下解方法证明了该模型解的一致有界性及其存在性;再应用线性化方法
主要就ASP.NET中对XML的访问方法,进行了研究和探索.介绍如何在ASP.NET中,采用DataSet的方式来使用XML,通过DataSet对XML的良好支持,可以将数据在XML与DataSet之间进行转移,
目的:观察与分析健脾益肾补血法对肺癌化疗者血小板的影响作用。方法:选取120例肺癌化疗者且将其分为两组,即中药加化疗组(观察组)以及化疗组(对照组),每组60例,同时给予两组患者相
主要研究Visual Basic 6.0不规则打印及预览的原理与实现技术,且给出每项技术的应用实例,示例程序介绍的方法稍作修改,即可实现VB各类程序不同形式的输出.