中文文本分类研究

来源 :太原理工大学学报 | 被引量 : 0次 | 上传用户：jscumt

【摘要】

：

使用k近邻、支持向量机和最大熵模型进行中文文本分类的研究，对目前应用较多的k近邻、支持向量机和最大熵模型，分别进行了基于特征词布尔值和基于特征词词频的中文文本分类实验

【作者】

：

郝晓燕常晓明

【机构】

：

太原理工大学计算机与软件学院

【出处】

：

太原理工大学学报

【发表日期】

：

2006年6期

【关键词】

：

文本分类 K近邻支持向量机最大熵 text categorization k-nearest neighbor support vector machin

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

使用k近邻、支持向量机和最大熵模型进行中文文本分类的研究，对目前应用较多的k近邻、支持向量机和最大熵模型，分别进行了基于特征词布尔值和基于特征词词频的中文文本分类实验。实验结果显示，在相同的条件下最大熵方法的分类性能最好，支持向量机次之，k近邻稍差。同时发现，在分类过程中引入了词语频率信息时，分类器的性能略有变化，对于最大熵分类准确率下降1％～2％，对于k近邻有所上升，对于支持向量机则相当。除去文本的特殊性影响，这表明不同程度的词语的信息对不同的机器学习算法有不同的影响。

其他文献

热处理工艺对双相纳米复合磁体性能的影响

采用磁粉晶化制备纳米晶磁材的方法,研究了热处理工艺对纳米晶复合磁体磁性能的影响.结果表明,热处理温度和时间明显地影响纳米晶的形成及其磁性能,热处理温度为700℃时,纳米

期刊

热处理工艺磁性能纳米复合磁体heat treatmentmagnetic propertiesnanocomposite magnet

MDV—gB重组痘苗病毒诱导的免疫保护性试验

用MDV-gB重组痘苗病毒RVV-gB,HVT冻干苗、痘苗病毒WR株分别按试验程序,对细胞免疫及体液免疫检测试验中的1日龄SPF鸡进行免疫接种,并于15日龄对各组小鸡攻GA株强毒,后经过IFA

期刊

MDV-gB重组痘苗病毒诱导保护性试验体液免疫细胞免疫鸡传染性肿瘤病recombinant vaccina viruscellular immu

西北工业大学论文为《国际航空宇航摘要》（IAA）收录在20行以上的已高达11篇

期刊

大型电除尘器钢结构立柱部件有限元分析