微博短文本细粒度情感分析

来源 :北京邮电大学 | 被引量 : 0次 | 上传用户:wearetgd1
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
微博作为是移动互联网起步最早也发展最快的业务之一,在经历了最初几年的高速增长和热捧之后,一度有些沉寂。但是,伴随着4G网络、WiFi网络大规模覆盖,移动终端智能设备的极速增长,越来越多的人频繁地使用微博。移动端用户的增长,让微博有了日活跃用户超过1亿的基础。基于该庞大的用户群体,利用微博文本对用户进行情感分析,不仅有利于新生代商业模式探索、社会舆情监控与分析,而且对人工智能发展的积极意义也不容小觑。文本情感分析为人工智能在人类情感领域的探索做出了积极的贡献。微博具有典型的网络语言特点,语法规范性差、口语化、新词汇层出不穷、大量的表情符号和文本噪声等。基于传统规范书面语言词典的微博情感分析效果差强人意。为了解决这个问题,本文一方面通过对传统情感词典进行网络语言的扩充,构建了新的适用于微博文本分析的词典,并通过实验验证了词典的有效性;另一方面,使用对特殊情感词汇依赖性小的递归自动编码机(Recursive Autoencoder,RAE)模型,性能得到了提高。含有否定词的文本情感判别较.为复杂,否定词的加入可能使原文本情感极性发生转变,也可能极性保持不变,程度有所削弱。传统本文传统的情感分析方法通常对文本模型进行简化,假设一个词语仅和其前一个词语有关,对含有否定词的文本的积极/消极判别较差。递归神经张量网络(Recursive Neural Tensor Network,RNTN)模型没有进行类似简化,保持了词向量之间的强相关性。本文通过对RNTN模型的训练,使其在含有否定词中文文本情感极性判别上达到了 80.7%的精度。RNTN模型对词语或短语级细粒度情感分析上表现出色,而且不需要大量的人工标注;RAE模型作为较为成熟的深度学习模型,抛弃了传统的词袋模型,利用层次结构和成分语义来进行情感分类;SVM作为传统机器学习方法,通用性强,适用范围广。结合以上方法的特点以及情感分类的任务目标,本文设计了微博短文本的双极性、细粒度情感分类方案,首先使用SVM对微博篇章进行主客观分类,RAE和RNTN对判定为主观情感的文本的每一个句子进行正负极性判断,并选出极性最强的句子,该句子的情感极性即为整个微博的情感极性。若RAE和RNTN评判语句极性一致,即为最终结果。本文设计方案F值、召回率、准确率均高于基于融合特征的方法。通过实验证明了系统的可行性和高效性。
其他文献
新媒体的出现改变着人们的生活方式,同时对青年大学生的价值观产生了深刻的影响。在新媒体时代,培育和践行社会主义核心价值观,要转变育人理念和教学方式,认识到它对大学生以
通过对2001—2014年我国男子游泳运动员最好成绩的变化和与世界最好成绩变化的比较,以及2009年和2013年近两届全运会男子游泳运动员比赛情况的调查,反映出中国男子游泳成绩的
莫欣农,毕业于清华大学工程数学力学系流体力学专业,后续攻清华大学力学系动力学与控制专业硕士学位。先后参加水利建设、船舶制造、卫星总体设计、CAD/PDM系统开发和应用、
本文通过对转化医学的提出背景、发展目标、研究路线图的系统介绍和对东、西方医学体系的差异及趋势分析,较全面地阐述了转化医学对新医药学发展所带来的启示。中医药学的优
目的探讨腹腔镜技术在小儿腹腔型隐睾治疗中的应用。方法回顾性分析2004年1月~2011年12月120例腹腔型隐睾患儿行腹腔镜手术的临床资料。结果 5例确诊为睾丸发育不良,切除睾丸
美国少年司法制度经过一个世纪的发展,已经形成了一套相对完备的少年司法体系。我国近年来少年违法犯罪事件频发,成为社会关注的焦点,而我国至今却未建立起现代少年司法制度
<正> 回顾2007年全国与各省市的物理高考命题,依然遵循"稳中有新,变中有新"的原则,其中热学部分的试题严格遵守考纲要求。即在分子动理论、热与功和气体这三方面考查学生对考
本文阐述了新形势下以党建为核心统领大学生思想教育工作的重要意义、必须坚持的工作思路及其重要途径,强调当前高校必须以“三个代表”重要思想为指导,以加强共青团建设为基
本报讯  全国医养结合与成功老龄化研讨会日前在上海召开,期间发布了《老年肌肉衰减综合征营养运动干预中国专家共识》。$$ 发布共识$$ 肌肉衰减综合征(sarcopenia)是与增龄
报纸
目的:基于小型猪的生理特点及循环系统与人类极为相似的特征,通过药物对其造模,建立一种新型的脉诊动物模型应用于脉诊教学中。方法:选用平均5个月龄,体重20±1.6kg,选取心率