基于深度学习的中文评论文本情感分析研究

来源 :华中科技大学 | 被引量 : 0次 | 上传用户:danielddy
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网的迅速发展与普及,网络上各种评论文本激增,例如电商平台的商品评论、社交网络平台的社交评论、生活服务平台的服务评论等。这些评论文本中大都包含着评论者对评论对象的情感倾向信息,挖掘其中情感倾向信息对于个人、企业以及社会都具有重大意义。自然语言处理中的文本情感分析技术能够从带有主观情感的评论文本中挖掘出情感倾向信息。传统基于词典和机器学习的情感分析方法已经无法满足海量评论文本情感分析的需求,因此,本文研究的是基于深度学习的情感分析方法,研究对象是商品评论和电影评论。首先,针对中文高质量情感分析评论语料相对匮乏的问题,使用爬虫技术从网络上爬取了大量商品评论和电影评论,并对其进行情感标注、文本清洗、中文分词等预处理工作,从而得到本文的评论文本语料。其次,使用word2vec模型对预处理后的评论文本进行文本向量化,并在基本的深度学习模型CNN、LSTM、GRU上进行情感分析实验。然后,针对使用word2vec训练的词向量仅包含词的语义信息而缺乏有利于情感分析的情感信息和权重信息的问题,提出了结合word2vec、词典、TF-IDF权重的词向量表示方法,并在评论文本语料上进行词向量对比实验。最后,为了在基本模型的基础上提高评论文本情感分析的效果,提出了一种将BiGRU的语义特征提取能力与CNN的深层特征提取能力相结合的BiGRU-CNN模型,并将该模型与该领域其它优秀模型在评论文本语料上进行模型对比实验。实验结果表明,在词向量的改进上,本文提出的融合词向量表示相比基本词向量表示能提高评论文本情感分析的Acc;在模型的改进上,本文提出的BiGRU-CNN模型,在商品情感二分类、商品情感三分类、电影情感二分类、电影情感三分类上的Acc分别达到了93.36%、78.65%、91.73%、78.52%,相比该领域其它优秀模型效果都要好,从而验证了本文提出模型的有效性。
其他文献
随着年轻肿瘤患者的发病率和治愈率的不断提高,以及放化疗所带来的不同程度的生育功能损害,年轻肿瘤病人保护和保留生育功能的诉求越来越迫切。作为增殖分化极度活跃的器官,
目的:探讨葡萄糖转运体4表达与葡萄糖代谢在大鼠心肌活力改变中的关系,并对其机理进行初步探讨。方法:30只健康雄性SD大鼠,SPF级,随机分成2组,分别为实验组21只和对照组9只。实验组
现代燃烧单元(Modern Burning Unit,MBU)是一款充分利用辐射热能的新型油气预混式燃烧器。为使其满足国内需求,本文以热效率、锅底吸热量及热流密度分布等作为评价指标,采用
本文主要探讨和研究电视新闻评论节目中主持人应具备的素养和能力,对新闻评论节目主持人进行角色分析,比较其与新闻主播和评论员的不同,并以当前我国一些优秀主持人为例,分析
有毒中药大多效用独特,在临床中若能谨慎、合理应用,便能收到立竿见影的效果;若人云亦云盲目使用,就有可能"事倍功半"导致中毒,甚至危及生命。从中药毒性的历史沿革、自我认
目的 :调查北京市市属医院门诊专科护理服务开展情况及患者的服务需求。方法 :采用自设调查表,对22家北京市市属医院护理部进行门诊专科护理服务开展情况调查。应用关键词检
近年来,随着我国汽车工业的快速发展传统内燃机汽车带来的一系列能源与环境问题日趋严重,而纯电动汽车以其节能、环保的优势成为缓解城市能源与环境压力的突破口。经过多年的探索与努力,我国电动汽车产业发展取得了巨大进步,但是在车架设计方面的研究大多应用于乘用车,而电动货车的车架大多由内燃机货车的车架改造而来。然而,电动载货汽车的动力源主要来自电动机和动力电池组,与传统的内燃机货车的区别较大,车架所受到的外界
随着留守儿童规模的持续增大,其社会情感发展问题也备受关注,培养积极的社会情感对留守儿童个人成长甚至社会发展都有至关重要的作用。从自我认知、自我管理、人际交往和社会
文章从分析企业档案信息资源整合共享的必要性出发,阐述了企业档案信息资源整合共享的原则,对企业档案信息资源物理整合与逻辑整合、共享主体和共享措施进行了探讨,指出了企
目的比较替吉奥与5-氟尿嘧啶(5-FU)用于中晚期直肠癌化疗的疗效及耐受性。方法选择本院92例中晚期直肠癌患者为研究对象,随机分为观察组与对照组,每组各46例,两组均实施奥沙