【摘 要】
:
针对KNN算法的分类效率随着训练集规模和特征维数的增加而逐渐降低的问题,提出了一种基于Canopy和粗糙集的CRS-KNN(Canopy Rough Set-KNN)文本分类算法。算法首先将待处理的文
【机 构】
:
曲阜师范大学信息科学与工程学院,曲阜师范大学软件学院
【基金项目】
:
国家自然科学基金(No.61402258);山东省本科高校教学改革研究项目(No.2015M102);校级教学改革研究项目(No.jg05021*)
论文部分内容阅读
针对KNN算法的分类效率随着训练集规模和特征维数的增加而逐渐降低的问题,提出了一种基于Canopy和粗糙集的CRS-KNN(Canopy Rough Set-KNN)文本分类算法。算法首先将待处理的文本数据通过Canopy进行聚类,然后对得到的每个类簇运用粗糙集理论进行上、下近似分割,对于分割得到的下近似区域无需再进行分类,而通过上、下近似作差所得的边界区域数据需要通过KNN算法确定其最终的类别。实验结果表明,该算法降低了KNN算法的数据计算规模,提高了分类效率。同时与传统的KNN算法和基于聚类改进的KNN文本分类算法相比,准确率、召回率和F1值都得到了一定的提高。
其他文献
目的研究水通道蛋白1(aquaporin1,AQP1)在卵巢癌耐药细胞株C13K化疗耐药中作用。方法构建AQP1正义真核表达载体,稳定转染卵巢癌耐药细胞株C13K,实时聚合酶链反应(real—timepolymer
浑河是纵贯辽宁省东、中部地区的大型河流,浑河流域的水源生态保护关系到整个辽宁中部城市群的发展。文章主要阐述了辽宁省近年来对浑河流域河道实施的生态保护及综合治理等
基于有机化学领域离域效应原理,采用单一变量法研制调堵剂体系,对调堵剂进行不同地层温度、矿化度和 pH 值的敏感性评价,并开展了室内高温物理模拟岩心驱替实验,评价调堵剂对于地
颅脑损伤后代谢型谷氨酸受体1a(metabotropic glutamate recep tor 1,mGluR1a)表达及竞争性拮抗剂1—氨基茚—1,5—二羧酸(AIDA)作用研究颅脑损伤是神经外科常见疾病之一,其发病率及
目的观察清热除痹方的抗炎镇痛作用。方法采用小鼠醋酸扭体实验及热板法实验观察清热除痹方的镇痛作用;采用小鼠毛细血管通透性实验及二甲苯致小鼠耳廓肿胀实验观察清热除痹方
用G-CSF动员的外周血单个核细胞(PBMNCs)自体移植能够改进下肢闭塞性动脉硬化和糖尿病足的肢体缺血状况。然而动员的外周血单个核细胞治疗肢体缺血的机制却不清楚。我们对后
目的 探讨对冠状动脉内支架植入患者实施整体护理的方法。方法 对29例行该手术的患者术前实施健康宣教,做好心理护理、术前指导、禁食护理、术后严密监测心电图和血压的动态变
临床器官移植的长期存活率得到明显提高,已成为终末期器官功能衰竭病人的最佳治疗方案。然而,同种异体排斥反应仍然是器官移植的主要障碍。诱导机体抗原特异性免疫耐受,是解
单纯性马蹄内翻足遗传易感基因的定位与鉴定前言单纯性马蹄内翻足(idiopathic congenital talipes equinovarus,ICTEV)是常见的严重危害儿童健康的先天畸形之一,主要表现为足前
将湘西乡村旅游发展系统划分为内外部系统,内部动力来源于资源开发、交通驱动与能人带动,外部动力来源于产业驱动、市场拉动、政策扶助。乡村旅游发展经历了内生自发阶段、市