基于深度学习的在线评论情感分析

来源 :兰州交通大学 | 被引量 : 1次 | 上传用户:dyqxcici
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
电子商务的崛起为企业和消费者发表评论意见提供了更加便捷高效的平台,越来越多的消费者购物后会通过网络表达自己对产品的喜好,而这些评论都带有强烈的个人主观感受。因此,在海量的文本数据中,如何挖掘出消费者的情感信息和潜在的商业价值已经成为现如今的研究热点。对这些评论数据进行情感分析研究不仅对消费者和商家在了解产品信息和制定营销策略方面具有指导意义,对相关管理机构也具有参考意义。然而传统的文本情感技术只能对篇章级或句子级的文本做出情感判断,无法给出具体评价对象的情感倾向,不能给消费者和企业提供更加全面的商品信息。所以,本文在深度学习算法的基础上,以真实的评论数据为研究对象,从特定目标的角度对文本进行细粒度层面的文本情感分析。首先,本文分别从粗粒度层面和细粒度层面分析了文本情感分析的过程及深度学习技术的基础理论,阐述了网络爬虫框架原理和评论数据的收集、预处理过程,其中包括对数据集的清洗、分词和情感标注。其次,本文采用了Word2vec技术将文本中的数据转化为词向量的形式,避免了数据维度过高和特征表示无关的问题,将训练产生的词向量作为深度学习模型的输入,提高了文本情感判断的准确率。最后,本文针对细粒度情感分析的问题,提出了注意力记忆网络。将评论语句中出现的一个或多个评价对象视为主题词,使用多个注意力机制计算层自动捕捉主题词上下文的重要信息,并引入记忆网络来存储文本信息,避免了传统的循环神经网络因记忆有限而丢失语义信息的问题。其次,本文针对单记忆模块单一的问题,提出了采用双记忆模块的方法,在每个记忆模块中对句子采取不同的建模方法,提取句子不同的特征信息,最后将二者提取的信息相结合作为分类器的输入。本文在中英文数据集的基础上,设置了多组对比实验,并分析了参数的不同对实验结果的影响作用。相比于其他方法,本文的方法不仅可以表达句子更丰富的语义特征,而且可以准确的判断出特定评价对象的情感值,情感分类的准率最高、效果最好。
其他文献
介绍了聚酯玻纤布复配及其沥青卷材的制备,从抗水抗冻融、抗老化、层间粘结和永久变形等方面对聚酯玻纤布沥青卷材和SBS改性沥青防水卷材的性能进行对比分析。结果表明,基质
接触辉光放电等离子体电解的一个显著特点是具有非法拉第效应,因此利用辉光放电产生等离子体的应用研究已经成为国内外研究热点。本文对液相辉光放电等离子体的有关特性进行
阐述了毛细管电泳在食品分析中的应用.主要包括糖类、氨基酸、脂肪酸、有机酸、矿物质、维生素、食品添加剂、农药残留量、生物毒素、抗生素残留量等食品成分的分析,并简要介
目的:研究乳腺良恶性病灶之间的血流差异,并探讨乳腺癌患者年龄、病灶大小、病灶浅层距皮距离及病灶所在腺体厚度对血流检出的影响;以及分析不同分子分型乳腺癌的BI-RADS超声
<正>工业互联网不要急于求成,应该踏踏实实、分门别类地持续推进,只有这样工业互联网才能走到智能制造阶段。8月23-25日,以"智能化:为经济赋能,为生活添彩"为主题的首届中国
为有效控制由于煤矿职工的不安全行为而引起的煤矿事故,利用效用理论建立了由于矿工不安全行为引起的损失函数,通过分析得到:不安全行为越多企业的损失成本越大,企业的安全操
在中国歌剧发展过程中,无数文艺工作者为歌剧事业的发展开拓创新。从歌剧《白毛女》到《江姐》,再到《党的女儿》等等,女性角色的塑造贯穿着整个中国歌剧的发展历史。可以说,歌剧中女性角色的塑造不仅是一种现象、一种审美,更体现出中国同西方国家歌剧之间所呈现出的文化以及美学的差异。作曲家关峡和词作家刘麟所创作的《木兰诗篇》也是一部以女性角色为主线的歌剧,并且在爱国主义精神中融合了和平的理念,以此彰显出如今的中
目的总结射波刀立体定向放射治疗对早期周围型非小细胞肺癌的近期疗效。方法回顾性分析中国人民解放军总医院2012年1月-2014年11月收治的40例早期(T1/T2N0M0)周围型非小细胞
大约在上世纪80年代中期,启功先生为我题了“红楼梦会心录”的书签。其时他还颇有余暇,一气写了三条,两竖一横,任我拣择。到了1990年,承其庸先生的鼓励和促进,《会心录》将在
为了提高中国环境教育的质量和普及性,国家教委(现教育部)、世界自然基金会和英国石油公司(中国)达成协议,推行“中小学绿色教育行动”项目。该项目于 1997年 7月正式启动, 2000年 9