基于文本和类别信息的KNN文本分类算法

来源 :计算机与数字工程 | 被引量 : 0次 | 上传用户:betterfo
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
提出了一种基于文本和类别信息的改进KNN文本分类算法。传统的KNN算法在计算样本相似度时利用的是文本和特征的相关信息,因此存在计算量大的明显缺陷,使其在具有大量高维样本的文本分类中缺乏实用性。新算法利用文本和类别的相关信息计算样本间的相似度,能够对特征维数进行有效的压缩。实验表明,该算法有较高的文本分类效率。
其他文献
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们羽 制作:陈恬’#陈川个美食 Back to yield
研究了Gompertz分布尺度参数的极大似然估计和区间估计方法,给出了Gompertz分布尺度参数的最短区间估计方法;通过实例验证了尺度参数的置信区间包含其极大似然估计值,指出了
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们羽 制作:陈恬’#陈川个美食 Back to yield
如何合理安排好补考学生的时间、减少监考人员的场次、最佳利用考场资源等项研究,具有很好的实用价值.事实上补考的复杂度、繁琐度不低于正式考试.文章提出一种新的基于人性
针对一类追逃对抗问题,基于微分对策理论,建立了三维空间中的追逃对抗模型,进而得到了最优性条件和最优策略.运用梯度迭代法给出了模型的数值解,并做了实例分析.分析结果显示
以阳煤集团新景矿8~#煤层开采为工程背景,在工作面实际地质条件下,建立了工作面推进过程中顶板变形的相似模拟实验系统。分析了随着工作面的推进,上覆岩层应力、岩层结构的变
目的探讨西药联合糖肾1号方治疗早期糖尿病肾病疗效。方法抽取来2016年1月—2017年8月该院接受治疗的早期糖尿病肾病患者116例按照随机双盲分组法划为对照组与观察组,各58例,
提出了一种螺旋桨桨叶造型的新方法--采用UG软件对螺旋桨桨叶进行精确实体缝合造型法,充分利用Matlab与UG的接口技术,对桨叶截面曲线的形成进行了优化,提高了造型精度,得到了