基于分类的微博新情感词抽取方法和特征分析

来源 :计算机学报 | 被引量 : 0次 | 上传用户:liuhu8207
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
情感或情绪分析在舆情分析、商品评论分析、商品推荐等领域应用广泛,而文本中的情感或情绪分析通常以情感词典为基础.人工情感词典虽然准确但构建代价大、难以及时更新,很难适应微博这类新情感词快速更迭的数据.微博平台为新情感词的发布和传播提供了便捷的途径,是新情感词的重要来源.考虑到已有规模较大的人工情感词典及大量包含新情感词的微博数据,在统计、分析、对比中、英两种语言微博中情感词分布差异的基础上,提出了与特定语言无关的基于分类思想的微博新情感词抽取方法cNSEm.cNSEm根据微博数据集和情感词典自动构建训练数据、训练分类器并判别候选词的情感极性,最后采用投票机制确定候选词的情感极性.通过大量而细致的实验,分析了cNSEm在中、英文两种语言的微博数据上的表现、六类特征的作用和用法以及抽取的新情感词对微博情感分类任务的帮助作用.实验结果表明,cNSEm比经典的基于共现和极性传播的方法要好,特别是当考虑中文微博数据集中的名词类情感词时.对cNSEm抽取的新情感词进行了直接和间接两种方法评测,前者利用人工情感词典作参照,后者考察抽取的新情感词对情感分类的帮助作用,从评测指标上看,cNSEm抽取的新情感词与人工情感词典的质量相当,并且cNSEm能适应有较大差异的中、英两个语种.
其他文献
1例经桡动脉行冠状动脉造影术患者术后发生桡动脉闭塞,表现为右前臂疼痛加重,血管搏动消失。给予加强术后巡视,严密观察桡动脉搏动及皮肤温度;注重生活护理。由于该并发症发
随着网络空间的高速发展,对网络安全防护技术提出了更高的要求。在大数据技术支持下,网络安全态势感知成为了实现网络安全监控的一种新技术,它能够动态反映当前网络安全状况,
目的了解中青年高血压患者治疗依从性现状及影响因素,并探讨能提高中青年高血压患者依从性的策略。方法采用问卷方式,对中青年高血压患者治疗依从性现状进行调查,并对结果进
<正> 课堂训练氛围也称课堂训练气 氛、课堂训练情绪场,是指师生在课堂 训练过程中,通过环境、情感的相互作 用而构成的心理情绪的综合反映。它 直接影响着师生的教学行为和
一年前,国务院机构改革方案确定,中国信息化领域大部制改革扬帆起航:“组建工业和信息化部”,国务院信息化工作办公室等相关部门职责“整合划入该部”,国信办“不再保留”。
1临床症状羊发病多为急性经过往往不出现任何前驱症状而突然死亡。有的在饲槽旁,有的在使役中或卸重后,突然发病倒毙。病程短的数分钟至数小时,长的十几个小时至几十个小时,致死
最近,地方电子政务中两件小小网事,引起关注:8月5日,浙江省宁波市鄞州区居民,通过网上“区长信箱”反映出行难问题。6天后,区长信箱仅反馈二字:“已阅”。8月19日,湖北省应城市市民,上
哈瓦利吉派是伊斯兰教历史上最早出现的极端宗教—政治派别,其极端主义思想曾在伊斯兰教历史上产生过严重的负面影响。作为宗教—政治派别的哈瓦利吉派虽已不复存在,但它所主
如皋黄鸡2009年8月通过国家畜禽遗传资源委员会遗传资源审定,确定为国家级家禽遗传资源,正式定名为“如皋黄鸡”,但对如皋境内包括如皋黄鸡原种场在内的多家种鸡养殖企业多年来