基于支持向量机的文本主题分类和情感分类研究

来源 :山西大学 | 被引量 : 0次 | 上传用户:tangq_000
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文基于支持向量机的方法对文本的主题分类和情感分类的进行了研究,对一些关键技术如特征的选取、权重的计算以及维数的确定做了详细的比较分析。主要研究内容如下: (1)介绍了KNN与支持向量机方法,并对这两种方法基于文本主题分类进行了实验,实验结果表明支持向量机是当前分类结果较稳定,精度较高,性能较好的方法。 (2)基于支持向量机方法对四种特征选择方法进行测试,结果表明,信息增益、交叉熵以及χ2统计的分类效果要优于互信息。 (3)研究了特征向量的维数与特征选择方法对分类结果的关系,结果表明,不同特征选择方法达到最大值时特征向量的维数取值是不同的。 (4)基于支持向量机的主题分类和基于支持向量机的情感分类的比较,实验结果表明,基于支持向量机的主题分类比基于支持向量机的情感分类效果要好,说明情感分类要比主题分类更复杂。
其他文献
本文主要在正则元集不是纯正子半群的一类π-正则半群(主要是GV-半群)中研究同余,其主要思想是核和迹的推广,再适当添加某些条件,给定同余对的概念,最后找到同余和同余对之间的一
学位
本文主要研究了体宾动词和名词以及谓词动词与动词构成的动宾搭配。文章介绍了已有的一些识别搭配对的方法:使用频率信息的搭配识别,基于均值与方差的搭配识别,基于假设测试和互
在计算机图形学领域,人们对地形绘制算法已经研究了很长时间,但它仍然是相当活跃的研究方向。大规模地形网格的实时绘制技术是目前人们广泛关注和研究的热点课题,它的应用涉及到
学位
信息安全对于一个国家的政治、经济和军事具有特殊的意义,作为信息安全重要手段之一的密码学因此越来越受到关注.传统的对称密码技术相对成熟,但存在密钥分配和大量密钥的保存
本文主要给出了GV-半群、GV-逆半群、左群的nil-扩张的半格、右群的nil-扩张的半格及矩形群的nil-扩张的半格的半直积的刻画,这些结果都是在不含单位元的情况下得到的.本文讨
学位