基于粗糙集与改进KNN算法的文本分类方法的研究

来源 :计算机与现代化 | 被引量 : 0次 | 上传用户:aassddff1984
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
KNN算法是文本自动分类领域中的一种常用算法,对于低维度的文本分类,其分类准确率较高。然而在处理大量高维度文本时,传统KNN算法由于需处理大量训练样本导致样本相似度的计算量增加,降低了分类效率。为解决相关问题,本文首先利用粗糙集对高维文本信息进行属性约简,删除冗余属性,而后用改进的基于簇的KNN算法进行文本分类。通过仿真实验,证明该方法能够提高文本的分类精度和准确率。
其他文献
为了满足形状描述子必须具有平移、尺度、旋转变换不变性,采用基于区域的形状描述子半径直方图(Radius Histo-gram Descriptor),对于半径尺度变换采用归一化处理,解决其不满足尺度不变性问题;通过角度直方图(Angle HistogramDescriptor)获得形状径向特征,并且对其进行傅里叶变换求得特征模值向量,解决其不满足旋转不变性问题。结合半径和角度直方图描述子,使得检索
目的比较分析经皮肾镜取石术和肾实质切开取石术治疗肾结石的临床效果。方法选取2017年2月至2019年2月我院收治的肾结石患者94例,随机分为实验组和对照组各47例。实验组采用