一种k-NN文本分类器的改进方法

来源 :情报学报 | 被引量 : 0次 | 上传用户:quartz
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
自动文本分类是提高信息利用效率和质量的有效方法。训练文本分布的不均匀会对分类的效果产生负面影响,而在实际中,很难使训练文本的分布达到均匀。针对这一问题,提出了一种改进的k-NN文本分类方法。通过在英文和中文两个文本集的实验表明,改进后的方法不仅分类的准确性有了提高,而且表现出较好的稳定性。
其他文献
传统的增量k均值法用于事件探测时存在着诸多不足。为了克服其缺陷,本文提出了一种用于事件探测的改进的增量k均值算法(IIKM)。该算法使用密度函数法进行聚类中心的初始化以便客
基于内容分析法对国内CRM理论的研究文献进行综合分析。根据客户关系管理的研究主题、研究目的及管理决策问题、管理研究方法等内容特征,设计了进行文献内容分析的三级类目框
从疫情爆发至今,物业股股价屡创新高,分拆上市成潮。不少物业服务企业忙于讲述资本故事,规模比拼拉开序幕,收并购频现江湖。与此同时,行业出现分化,优质企业加速胜出,实力欠
目的:观察金荞麦片口服联合复方康复新液直肠滴入治疗轻、中度溃疡性结肠炎的临床疗效。方法:从我院2012年3月-2015年12月接收的90例轻、中度溃疡性结肠炎患者中随机分为中药组
在电子商务系统中,为了帮助用户有效地发现、过滤和利用信息,信息过滤技术应运而生。协同过滤技术作为其中的一种技术被成功地应用于推荐系统中。随着电子商务用户数目和商品数