基于BiGRU-Attention模型的文本情感分析研究

来源 :辽宁工程技术大学 | 被引量 : 0次 | 上传用户:gebmmi
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着各大电商平台的兴起,人们倾向网购并对商品做出评价,成为流行趋势,评论数据量每天数以亿计的增长。这些看似毫无规则或关联性不大的评论,当数据达到一定程度,细分到某个行业或某类商品时,分析这些数据就能看出人们对某个行业或者某类商品的一种普遍看法,对分析、研发商品、预测销售前景具有非常重要的价值,因此文本情感分析近些年变得流行。最初的文本情感分析算法是基于机器学习的算法,但是随着数据量的增大,机器学习的算法无法适应快速处理数据的需求,适合大数据分析预测的神经网络模型开始在自然语言处理(NLP)领域广泛应用。CNN最先用来做文本情感分类,CNN不能学习上下文信息的特征使RNN开始应用在文本情感分类中,RNN梯度弥散的问题使得长短时记忆神经(LSTM)、循环门控神经网络(GRU)、双向长短时记忆神经(BiLSTM)、双向门控循环神经网络(BiGRU)等变体开始流行。后来,注意力(Attention)机制被证明了突出局部信息的有效性;研究人员开始尝试把神经网络模型和注意力机制进行模型混搭,实验结果证明了这种混搭模型的有效性。针对当前模型没有考虑评论可能存在的拼写错误、词向量长短不一且应用较多的BiLSTM训练时间过长、不能充分提取文本信息的问题,本文提出了一种基于BiGRU-Attention的文本情感分析模型,在预处理前导入textblob包修正可能存在的拼写错误,在输入层用pad_sequences填充为固定长度、利用双向门控循环网络(BiGRU)提取信息,利用注意力(Attention)机制突出词向量重点信息。BiGRU-Attention模型采用六层结构,把文本词向量经输入层、进入神经网络(BiGRU)层提取特征,放入注意力(Attention)机制突出词向量的重点信息,放入Dropout层防止过拟合,经过全连接层,最后放入softmax层进行文本情感分类。BiGRUAttention模型在四种数据集上进行多组对比实验,验证了BiGRU-Attention模型有效性。该论文有图33幅,表14个,参考文献52篇。
其他文献
双钢板混凝土结构是一种将钢板外包于混凝土而形成的组合结构,具有良好的受力性能和抗冲击性能,已应用于我国第三代核电机组屏蔽厂房中。2009年以后美国、法国、中国等国家纷
科技创新已经成为高等学校人才培养的重要内容,培养现阶段具有创新意识的人才具有重要的战略意义。对组织学生开展科技创新活动的经验进行了详细介绍和深入分析,科学的工作流
尽管经椎弓根螺钉内固定从介绍到广泛推广经历了重重困难,但最终大大推动了脊柱外科疾病手术治疗的进程.现就经椎弓根螺钉内固定的历史、生物力学机制、固定原理和适应症、应
该项目2008年9月顺利通过了科技部组织的中期检查评估。自立项以来,该项目紧紧围绕着农业干旱、东北玉米和新疆棉花低温冷害、华南寒害、长江中下游水稻高温热害、小麦晚霜冻
20世纪70年代,美国传播学家蒂奇诺等人在继《芝麻街》教育片的影响等一系列实证研究的基础上,提出了这样的理论假说:“即由于社会经济地位高者通常能比社会经济地位低者更快
随着社会经济的不断发展,新课程改革的不断深入,新课改的大背景之下物理教育者在他们的教学理念和教学模式上都有了进一步的改变,物理学科与其他学科有着很大的不同,物理学科
目的探讨放射性肺炎发生的因素.方法对19例放射性肺炎进行临床分析.结果全组放射性肺炎发生率:肺癌6.6%,乳腺癌8.6%.单纯放疗为6.4%,合并化疗为9.4%.结论预防放射性肺炎发生,
The strain accumulation state in crustal interior and its migration trend can be inverted from observational data of earth tide tilts.In China,large earthquakes
期刊
1997-1998年间我院160例眼外伤住院患者临床研究的部分结果。男性占79.38%,女性占10。0%,年龄分布多发生在21-40岁;职业依次为工人,农民和学生等;致伤性质中角巩膜裂伤62例,钝挫伤36例,受伤后24小时就诊85例;治疗前视力低