基于文本和类别信息的KNN文本分类算法

来源 :计算机与数字工程 | 被引量 : 0次 | 上传用户：betterfo

【摘要】

：

提出了一种基于文本和类别信息的改进KNN文本分类算法。传统的KNN算法在计算样本相似度时利用的是文本和特征的相关信息，因此存在计算量大的明显缺陷，使其在具有大量高维样本的

【作者】

：

艾英山张德贤

【机构】

：

河南工业大学信息科学与工程学院

【出处】

：

计算机与数字工程

【发表日期】

：

2009年11期

【关键词】

：

文本分类 K近邻法特征降维类别分布 text classification KNN feature reduce sort distribution

【基金项目】

：

河南省科技攻关项目（编号：0324220024）资助.

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

提出了一种基于文本和类别信息的改进KNN文本分类算法。传统的KNN算法在计算样本相似度时利用的是文本和特征的相关信息，因此存在计算量大的明显缺陷，使其在具有大量高维样本的文本分类中缺乏实用性。新算法利用文本和类别的相关信息计算样本间的相似度，能够对特征维数进行有效的压缩。实验表明，该算法有较高的文本分类效率。

其他文献

微信公众平台用户体验与用户使用意愿关系实证研究

回回产卜爹仇贱回——回日E回。”。回祖一回“。回干肉果幻中 N_。NH lP7-ewwe--一”＄ MN。W;- __._——————》砧叫]们羽制作:陈恬’＃陈川个美食 Back to yield

期刊

TAM用户体验使用意愿

Gompertz分布尺度参数的最短区间估计

研究了Gompertz分布尺度参数的极大似然估计和区间估计方法,给出了Gompertz分布尺度参数的最短区间估计方法;通过实例验证了尺度参数的置信区间包含其极大似然估计值,指出了

期刊

Gompertz分布区间估计最短区间Gompertz distributioninterval estimationshortest interval

冲坏顾客胶卷应赔多少

期刊

顾客胶卷冲坏消费者权益保护法赔偿金额

非甾体抗炎药昔康类化合物衍生物的合成研究

学位

昔康类衍生物苯并异噻唑啉酮13-苯并噻嗪-4-酮溴化钾磷酸三钾

基于人性化冲突解决算法设计模型

如何合理安排好补考学生的时间、减少监考人员的场次、最佳利用考场资源等项研究,具有很好的实用价值.事实上补考的复杂度、繁琐度不低于正式考试.文章提出一种新的基于人性

期刊

人性化冲突解决算法设计模型补考算法复杂度合理安排资源约束条件算法模型实用价值合理抽象关键因素式考试优化学生文章时间考场监考

基于梯度迭代法的一类追逃对抗模型研究

针对一类追逃对抗问题,基于微分对策理论,建立了三维空间中的追逃对抗模型,进而得到了最优性条件和最优策略.运用梯度迭代法给出了模型的数值解,并做了实例分析.分析结果显示

期刊

追逃对抗微分对策梯度迭代法pursuit and evasion resistance differential game gradient method

低透气性煤层开采覆岩应力与变形特征实验分析

以阳煤集团新景矿8~#煤层开采为工程背景,在工作面实际地质条件下,建立了工作面推进过程中顶板变形的相似模拟实验系统。分析了随着工作面的推进,上覆岩层应力、岩层结构的变

期刊

煤层开采相似实验顶板变形特征分析coal seam miningsimilar experimentroof deformationfeature an

西药联合糖肾1号方治疗早期糖尿病肾病疗效分析

目的探讨西药联合糖肾1号方治疗早期糖尿病肾病疗效。方法抽取来2016年1月—2017年8月该院接受治疗的早期糖尿病肾病患者116例按照随机双盲分组法划为对照组与观察组,各58例,

期刊

胰岛素糖肾1号方糖尿病肾病

法律不是"闹"着玩的

期刊

交通肇事派出所聚众冲击扰乱公共秩序罪

螺旋桨桨叶计算机实体造型方法研究

提出了一种螺旋桨桨叶造型的新方法--采用UG软件对螺旋桨桨叶进行精确实体缝合造型法,充分利用Matlab与UG的接口技术,对桨叶截面曲线的形成进行了优化,提高了造型精度,得到了

期刊

螺旋桨UG软件桨叶实体造型propeller UG software leaf 3D solid modeling

基于文本和类别信息的KNN文本分类算法

与本文相关的学术论文