基于深度学习的短文本情感倾向性分析研究

来源 :北京工业大学 | 被引量 : 2次 | 上传用户:xiatiandegushi1989
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着社交媒体和电子商务的发展,越来越多的用户开始使用社交网络服务表达自己对商品、公众人物、新闻事件等各类话题及对象的观点和看法。如果能够从这些海量的信息中挖掘出有价值的情感信息,将会推动产品推荐、舆情监测、民意调研等方面的发展。文本情感倾向性分析旨在对带有情感色彩的文本进行情感极性判断,是文本情感分析的一项核心任务,具有非常重要的研究价值,同时也面临着许多挑战。基于深度学习的分类方法具有很好的适应性,而且特征学习能力比较强大,具有很大的竞争力。但是,目前已有的深度学习方法在文本特征向量表示时较单一,并且没有有效利用文本数据中的关键字。因此,本文针对存在的问题,主要研究工作如下:(1)针对文本表示问题,提出了多粒度融合的卷积神经网络(MultiGranularity Fusion Convolution Neural Networks,MGF-CNN)文本情感分类算法。首先,将词性特征、位置特征和词向量特征进行结合,提出一种多粒度特征融合的文本表示方法。然后,通过卷积神经网络(Convolution Neural Networks,CNN)进行特征提取。为了提取到更多更重要的文本特征信息,本文采用了不同尺寸卷积窗口和最大池化操作方法。最后,在中英文两种语言的评论数据集上进行测试,实验结果表明:MGF-CNN模型与单一词向量表示的深度学习算法相比准确率明显提高。(2)为了更好地提取句子的序列特征,对句子中的关键词给予更多的关注。本文提出将卷积神经网络和双向长短时记忆网络(Bidirectional Long Short-Term Memory,BiLSTM)进行组合,并将融合后的特征添加注意力机制(Attention Mechanism),设计出CBLSTM-Attention模型。首先,利用CNN提取句子的局部特征,利用BiLSTM提取上下文序列特征,将两种神经网络提取的特征进行结合,获取到更全面的文本语义表达。然后,将融合后的特征,通过基于门控机制的注意力模型,对不同的词赋予不同的权重,使模型更加关注与输出结果有关的特征。实验证明:CBLSTM-Attention模型与其他代表性论文工作进行比较,在中英文四个数据集上均提高了文本分类的准确率。
其他文献
新闻评论,毫无疑问,重在“评”和“论”,就是说,主要是说理,要以理服人。但要写好一篇评论,光具备说理性还不够,还应该将说理与抒情相结合,力求以情感人,以情动人。关于新闻
在对高校贫困生予以经济资助的同时,贫困大学生的心理问题也急需予以关注,本文针对贫困大学生所普遍具有的心理问题,分析其成因,并提出相应的对策。
海口晚报在创刊6周年之际,举办了重奖征求批评和建议活动。该活动为此设一等奖1名,奖南宝牌21英寸平面直角遥控彩电1部,赠阅该报一年;二等奖10名
食管壁的损伤是食管异物和食管镜检查常见并发症,轻则仅为食管粘膜擦伤和粘膜下血肿,经保守治疗可痊愈;重则发生食管穿孔,可危及生命.我院地处沿海地区,居民食用鱼类较多,食
磁耦合谐振式无线电能传输技术(Magnetically-Coupled Resonant Wireless Power Transfer,简称MCR-WPT)是一种运用电磁谐振原理来实现能量高效稳定传输的技术。与电磁感应式
建构主义理论强调学生的主体地位和知识建构中"情境"与合作学习的重要性,强调教学的最终目标是帮助学生完成认知建构。大学英语翻译教学可从情景创设、小组合作、桥梁搭建、任
社会主义市场经济给新闻带来繁荣景象,每天翻开中央和地方报纸,都给人勃勃生机的感觉。但是,任何一个新的东西,在它的发展过程中都会有波折,都会在某些方面暴露出偏激的因素,
随着国家经济实力不断提升,人们对于精神文化娱乐生活的追求也变得更加明显,尤其是在国家文化产业取得良好发展的背景下,许多外来电影开始引入中国,为了更好满足中国观众的观
任何人不因思想受处罚,表明法律不禁止思想。思想不是法律规制的对象,只有行为才是法律的规制对象。法律是行为规范,而不是思想规范。格言解析任何人不因思想受处罚这一罗马