基于监督学习的中文情感分类技术比较研究

来源 :中文信息学报 | 被引量 : 0次 | 上传用户:sxj007
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
情感分类是一项具有较大实用价值的分类技术,它可以在一定程度上解决网络评论信息杂乱的现象,方便用户准确定位所需信息。目前针对中文情感分类的研究相对较少,其中各种有监督学习方法的分类效果以及文本特征表示方法和特征选择机制等因素对分类性能的影响更是亟待研究的问题。本文以n-gram以及名词、动词、形容词、副词作为不同的文本表示特征,以互信息、信息增益、CHI统计量和文档频率作为不同的特征选择方法,以中心向量法、KNN、Winnow、Na ve Bayes和SVM作为不同的文本分类方法,在不同的特征数量和不同规模的训练集情况下,分别进行了中文情感分类实验,并对实验结果进行了比较,对比结果表明:采用Bi Grams特征表示方法、信息增益特征选择方法和SVM分类方法,在足够大训练集和选择适当数量特征的情况下,情感分类能取得较好的效果。
其他文献
随着信息技术的迅猛发展,传统会计已经不能满足企业管理新的信息需求,由此出现了对网络会计、事项会计和价值链会计等新领域的研究和应用热潮。文章对网络会计、事项会计、价
目的:本研究包括两部分:第一部分:系统评价不同剂量咖啡因治疗早产儿呼吸暂停(apnea of premature,AOP)的疗效及安全性。第二部分:系统评价不同时间应用咖啡因治疗AOP的疗效
针对优化工艺参数和结构尺寸在整体壁板固化变形控制方面的局限性问题,提出了通过面板非对称铺层来控制整体壁板固化变形的方法。采用整体壁板和非对称层合板固化变形的特征,面
目的探讨人工股骨头置换术治疗老年股骨颈骨折的护理方法。方法回顾分2010年4月——2012年5月在我院行人工股骨头置换术的98例老年股骨颈骨折患者的临床资料,总结围手术期的
目的评价SPECT/CT同机图像融合技术诊断股骨头缺血性坏死的临床应用价值。方法53例临床可疑股骨头缺血性坏死患者行全身骨显像及骨盆局部SPECT/CT断层显像并对SPECT和CT同机
<正>百花丛中姹紫嫣红,群芳争艳,其中有一种花,它既不生长在庭院中,也不开放在溪水边,却光艳夺目。它绽放在节日夜空,变化万千,无数人为之倾倒、赞叹,它就是烟花。烟花与爆竹
目的:研究白花蛇舌草总黄酮(FHD)对人肝癌细胞SMMC-7721,BEL-7402的体外抑制作用,对小鼠移植性肝癌H22的体内抑制作用和对其增殖周期、凋亡、免疫功能的影响.方法:MTT法评价FHD
<正>绘画的魅力在于体验与感受的排 它性和不可替代性。而表现方式的选择 更是出自艺术家内心的体验与需要。 每个艺术家都在追寻符合内心体
采用溶液聚合法并按照自由基机理,聚乳酸与低表面能单体甲基丙烯酸十三氟辛酯按照自由基机理发生接枝共聚反应,合成得到几种不同接枝率的聚乳酸接枝共聚物。FT-IR和1H NMR证
<正>新经济业态具有科技创新、商业模式创新、经济集聚形态与方式创新等特征,具有智力密集型与高成长性的特点。近年来,杭州市积极贯彻省委"两创"总战略,大力发展文化创意产