【摘 要】
:
KNN算法在数据挖掘的分支-文本分类中有重要的应用。在分析了传统KNN方法不足的基础上,提出了一种基于关联分析的KNN改进算法。该方法首先针对不同类别的训练文本提取每个类
【基金项目】
:
国家自然科学基金资助项目(61170322,71171117);江苏省自然科学基金资助项目(BK2010524)
论文部分内容阅读
KNN算法在数据挖掘的分支-文本分类中有重要的应用。在分析了传统KNN方法不足的基础上,提出了一种基于关联分析的KNN改进算法。该方法首先针对不同类别的训练文本提取每个类别的频繁特征集及其关联的文本,然后基于对各个类别文本的关联分析结果,为未知类别文本确定适当的近邻数k,并在已知类别的训练文本中快速选取k个近邻,进而根据近邻的类别确定未知文本的类别。相比于基于传统KNN的文本分类方法,改进方法能够较好地确定k值,并能降低时间复杂度。实验结果表明,文中提出的基于改进KNN的文本分类方法提高了文本分类的效率和
其他文献
定价:58.00元本书系“认知语言学与汉语研究丛书”之一。从人们话语“解码”的角度来考察汉语句式,解释人们语言解码机制中蕴含的认知动因,论述了功能主义与信息结构、语法的
目的:分析使用红霉素软膏结合活肤泉水治疗口周皮炎,在缓解本病临床效果方面的作用。方法:临床确诊口周皮炎患者50例,随机分为三组:红霉素治疗组:给予红霉素软膏外用,每日2次;活肤泉
网络时代的到来,既为高校大学生思想政治教育带来新契机,又使当前的大学生思想政治教育面临着严峻的挑战。网络既可以使思想政治教育的开展更加广泛灵活,又容易使大学生陷入
目的探讨协同刺激分子可溶性CD40配体(sCD40L)及CD4+T辅助细胞CD45RA和CD45RO亚群在儿童特发性血小板减少性紫癜中的变化。方法用ELISA法检测25例ITP患儿血浆sCD40L水平;用微量
目的探讨前列腺增生患者睡眠现状及护理对策。方法 2006年1月~2009年1月对126例前列腺增生患者采用SPIEGEL量表评价睡眠障碍程度,分析睡眠障碍现状,制定护理对策。结果 126例
目的:研究γ-氨基丁酸茶对小鼠的抗疲劳作用。方法:采用昆明种小鼠游泳力竭实验,实验动物分为γ-氨基丁酸茶高、中和低实验组及空白对照组,分别检测游泳力竭时间,测定小鼠血糖
<正>2017年底,贵州省率先在西部实现21817个建制村100%通沥青(水泥)路、100%通客运的"双通"目标,成为西部第1个、全国第14个实现建制村通畅、全国第10个实现村村通客运的省份
通过3种喷雾器和2种农药组合的6个处理,对烟草赤星病进行防治试验。结果表明,选用WS-18D电动喷雾器(山东卫士植保机械有限公司生产)和10%宝丽安可湿性粉剂(生物农药)防治烟草赤星病,
目的对椎-基底动脉的应用解剖学进行研究分析,为颈椎手术治疗提供依据。方法选取当地实验中心的15具成人尸体的头部标本进行研究,对标本进行灌注和解剖,观察右侧和左侧椎动脉
为增强辐射事故应急预案编制及修订的科学性、针对性和实用性,依据辐射事故应急预案的特点和法律法规要求,基于层次分析法构建目标层、准则层和方案层三级层次结构,提出9项准