基于深度学习神经网络框架的文本情感分析应用研究

来源 :武汉大学 | 被引量 : 5次 | 上传用户:xiangshuhua
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网技术的发展,越来越多的网络用户在互联网平台上所产成的情感数据呈爆炸式增长,网络用户每天都会发布并传播高达上亿的信息量,在这些海量的文本信息中,很大一部分是表达用户观点和情感倾向的文本数据,因此有关情感分析的研究逐渐成为自然语言处理领域的重要研究目标。随着计算机技术的发展,传统的统计研究方法已经不能满足现在大数据的数据状况需求。因此,本文通过搭建深度神经网络框架,利用其端到端的数据处理能力和较快的计算速度,针对从各大网商平台搜集的购物评论数据进行有关情感分析的研究。本文对深度神经网络模型解决情感分析问题做了较深入的研究,其中重要的研究工作如下:(1)针对情感分析中的传统研究方法进行综述性介绍,并从统计语言模型、词向量技术以及现有基于深度学习框架的神经网络模型等方面对情感分析研究的主流方法进行总结。(2)针对大量的评论数据集进行分析发现,现有主流的评论数据的形式多以句子形态存在,并且具有一定的输入长度限制,例如微博评论文本长度最多为140字,这些评论数据大多属于短文本范畴。因此本文将以词作为单位将评论数据进行分词处理,然后将分词结果进行编号处理,再以“词向量”的矩阵形式输入到LSTM模型中进行分类学习,利用LSTM结构具有端到端的特性,可以直接将原始数据和标签输入,自动完成学习任务。并且测试集的分类准确率达到91.23%。(3)针对LSTM对于数据的向前依赖问题,本文设计了双向LSTM模型和双向GRU模型,探究了双向LSTM和GRU模型对于情感分析研究的影响。该方法利用深度学习工具Karas库的相关架构,可以大大降低神经网络相关代码编译的复杂程度,对模型进行优化处理后,最终的实验结果准确率分别为92.47%和91.69%。(4)针对模型的优化,本文提出了 Attention机制,由于本文的语言模型是典型的时序模型,通过引入Attention矩阵,对数据上下文进行权重的筛选,从而加强了数据特征的选取精确度,最终的实验结果准确率达到97.83%。
其他文献
以国内近期典型MTO装置的腐蚀事例和实际的防腐蚀措施为依据,调查研究了现阶段MTO装置管道设计中的管子、管件、阀门等通常采用的金属材料及制造要求,对比分析了管子、管件材
汪精卫,名兆铭,广东“士家出身”,早年曾追随孙中山参加资产阶级民主革命,以国民党左派姿态活跃于广东政治舞台上。日本全面入侵中国并攻占广州后,汪精卫公开投敌,随后在南京
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们羽 制作:陈恬’#陈川个美食 Back to yield
作为科学的管理方法,绩效管理有其特定的科学内涵和管理流程。业绩评价是绩效管理的首要任务;关键绩效指标(Key Performance Indicator)即KPI,是用于评估和管理被评估者绩效的定
"甲壳虫"汽车的问世来自战争狂人希特勒的一种构想。早在上世纪30年代,希特勒提出要让每一个德国家庭都有一辆便宜、耐用的轿车,能坐5个人。根据这样的构想,1932年德国著名的
深入挖掘澳洲淡水龙虾的池塘养殖技术,对于推广和探索澳洲淡水龙虾的生态养殖,推动我国水产业经济发展有着重要的意义。本文首先介绍了澳洲淡水龙虾的生物特征,然后简要描述
恶臭污染已成为炼化污水处理场的严重公害,本文阐述了污水处理场恶臭污染源的产生及危害,综述了恶臭的治理技术,重点讨论了生物技术在除臭中的应用,提出了生物除臭技术的重点研究
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们羽 制作:陈恬’#陈川个美食 Back to yield