基于LSTM的文档级别情感分析方法研究

来源 :天津大学 | 被引量 : 0次 | 上传用户:nayinian2688
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着以人为中心的Web2.0时代的蓬勃发展,互联网中产生了大量关于人物,事件,产品等包含用户情感的有价值的评论信息,文本情感分析技术能有效挖掘其价值,因此越来越受到关注。对于短文本的词语级别以及句子级别的情感分析已经开展了多年研究并取得较好成绩,但是对于文档级别情感分析,尤其是长文本的建模仍然是一个巨大的难题,虽然LSTM神经网络在长文本建模上取得了巨大的成功,但LSTM依然会存在对长序列学习不完整的问题,因此亟待研究新的篇章级情感分析方法。针对以上问题,本文设计并实现了一个基于的LSTM的分层神经网络结构并且尝试提出了多种改进的方法。首先,本文提出了一种双层LSTM的模型,第一层对文档中每个句子进行词到句子的建模,第二层是对文档中的所有句子到文档进行建模。其次,为了提高模型的训练效果,本文提出了一种基于情感词典的方法,来过滤掉一些客观性句子,减少模型训练的噪声。最后,为了考虑句子中词语间的空间结构,本文用Tree-LSTM代替传统的序列LSTM对词语到句子进行建模,来得到更好的句子向量。实验结果表明基于的LSTM的分层神经网络结构及其改进的方法在三个公开的大规模的文档级别数据集上都具有良好的表现,同时与传统LSTM相比,Tree-LSTM可以得到更好的句子的表示。
其他文献
区块链的本质是一个所有参与节点共同维护,公开透明的分布式账本,但并非某个单独的用户可以对它随意修改,只有通过共识机制选出的区块链节点才可对其更改。具有去中心化,不可
生物体内,分子马达是一类能将三磷酸腺苷ATP的化学能,转化为动能的生物大分子物质。在真核细胞中,起物质运输功能的分子马达有三大类:肌球蛋白,动力蛋白以及驱动蛋白。其中肌
目前,国内既有公共建筑占比高,能耗强度大,对其进行节能监管势在必行。公共建筑能源审计作为建筑节能监管体系中重要的环节,面临着智能化的问题。本文以能源审计中的重要审计
随着我国经济的迅猛发展,建设山区支线机场成为迫切的需求。山区支线机场的建设面临着诸多复杂问题,例如,山区中平原面积有限,大面积工程建设过程中需要爆破块石来平整沟谷,
现有组合结构大多使用的栓钉作为抗剪连接件。此类连接件还存在需改善的问题:埋进混凝土板的栓钉连接件,会产生应力集中现象,引起混凝土板开裂,减少组合梁的使用年限;栓钉通
光是重要的环境因子,能够调控生物的多种发育与生理进程。对陆生植物来说,光不仅是光合作用的能量来源,还作为一种调控生长与发育的信号分子。光的感知是植物进行光信号转导
林分密度对林木个体的生长和发育有着重要影响。雌雄异株植物不同性别间个体在形态和发育上也存在差异。雌雄株生长和发育对林分密度变化的响应是否相同?人工林同一密度下雌
凸空间理论是通过抽象凸集的基本性质而得到的一门处理集合系统的数学分支.凸空间理论与拟阵理论和拓扑理论有着非常紧密的联系,它们有许多共同的特征.随着模糊拓扑学和模糊拟阵理论发展的影响,相继出现了多种不同类型的模糊凸结构.当前比较具有代表性的模糊凸结构主要有L-凸结构、M-模糊化凸结构和(L,M)-模糊凸结构.对于模糊凸空间理论的研究也主要基于这三种框架开展.其中(L,M)-模糊凸结构以经典凸结构,L
既有钢筋混凝土桥梁在铁路桥梁中占据很大比例,桥梁形式主要为板式以及肋板式桥,由于其服役年限相对较长,梁体劣化情况普遍较为严重,其中更有部分桥梁受病害影响,致使桥梁存
替代传统化石燃料的新能源技术研究与应用是全球技术研究热点之一,如何缓解和解决环境问题是全球的共同目标,新型能源以及储能技术是未来替代传统能源的必由之路。MnOOH,MnO2