基于双通道混合神经网络的商品评论情感分析研究

来源 :信阳师范学院 | 被引量 : 0次 | 上传用户:fatcat120
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在“互联网+”的背景下,网络电商平台迅速发展,人们的生活习惯也随之发生了改变,越来越多的人热衷于网上购物并在网络平台上发表意见,以表达对产品属性的情感倾向,从而产生源源不断的商品评论信息。在这些数据中往往包含了大量的用户情感因素,如果能有效地挖掘出用户评论的情感信息,这不仅能为商家提供信息反馈,便于商家及时调整销售决策,还有利于社会调查以便政府做出行之有效的对策。因此研究针对商品评论的文本情感分析具有重要的商业价值和社会意义。在互联网时代,每天都有上亿条信息产生,面对如此大规模的数据量,传统的情感分析方法面临着一系列的挑战,如不能全面提取文本中的情感信息、解决模型训练时间较长以及无法对目标特征进行深层情感挖掘等众多问题。为解决上述不足,本研究从模型设计和参数训练两方面进行改进和完善,提出了一种基于双通道的混合神经网络商品评论情感分析模型。主要创新点体现在如下三个方面。(1)在以往的情感分析方法中,一般只使用单一的字或词嵌入信息作为输入来源,这会导致文本语义信息学习不全面,造成遗漏信息的风险。针对此弊端,提出在模型中引入Char-Embedding和Word-Embedding,使模型具有同时从词级别粒度和字级别粒度的嵌入向量中学习情感特征的能力,可解决现有模型存在学习特征不全面的缺点,在一定程度上可改善模型的特征学习能力。(2)通过大量的研究发现,目前在传统的情感分析方法中并没有对特征信息的融合方式做进一步研究,只是将提取的特征向量进行简单的拼接,这很容易出现忽略目标特征的权重分配问题,导致模型对文本的区分能力降低、训练时间变长。针对此问题,提出在模型的特征融合层引入Attention技术,进而提高模型对关键信息的分辨能力。此技术利用计算出的权重值与不同的特征信息进行相乘,有效地放大了目标特征向量的情感信息,从而减弱了非目标特征向量的情感信息。(3)常规TextCNN网络的最大池化层存在的缺陷:在卷积操作后,文本特征的位置信息通常是会被保留下来的,但是经过Max-Pooling后只保留了部分得分最高的特征,而其它分值低但出现频次高的强特征信息却都被丢掉,造成了特征信息大幅度损失的问题。针对此缺陷,提出将Max-Pooling替换成K-Max-Pooling,这种策略不但可以获取所有特征值中得分最高的前Top-K特征,还能保留提取特征的原始序列。这在一定程度上可缓解TextCNN网络的不足,还有助于提升模型的分类性能。
其他文献
目的探讨高压氧对轻度认知功能障碍模型大鼠ERK信号通路的变化及认知功能的影响。方法SD雄性成年大鼠48只随机分为四组(n=12):空白对照组、MCI组、高压氧组(HBO组)、U0126组。连
在人才竞争激烈的背景下,教育发展成为各国关切问题。在发展本国教育的同时借鉴国外教育的优秀教育经验也是必不可少的。该翻译实践报告选取了Reinventing Education in America一书进行英汉翻译,希望对国内教育工作者以及家长有所启发,从而更好地进行儿童教育。本翻译实践报告以笔者参与的英汉翻译实践为基础,以目的论为指导,探讨文本翻译中专业术语及长难句等问题的应对策略及翻译技巧。在翻
背景:STAT3(信号转导和转录激活因子3)在肿瘤的发生和发展中起着非常重要的作用。口腔鳞状细胞癌(OSCC)是头颈部鳞状细胞癌最常见的类型。STAT3在头颈部鳞状细胞癌中的表达显
自然类在最近几十年来一直是吸引哲学家们关注的一个重要问题。什么是自然类,它是否可通过本质来定义,它是否真实存在于自然界中?关于这些问题,当代哲学家们展开激烈争论,并
在中国经济发展的新时期,转变发展方式、优化经济结构、转换增长动能等任务尤为艰巨、突出和迫切。基于产业融合的跨界并购是新时期并购重组的重要特征和发展趋势,与传统意义
生物特征识别技术由于其便捷和安全性已经被广泛地应用在当今社会中,而语音作为一种重要的生物特征,蕴含了非常丰富的信息,且由于智能设备的普及,说话人语音的采集成本也非常低廉。因此,对说话人的语音进行分析具有重大的实际应用价值。本文主要讨论了基于深度学习的说话人的声纹识别,并拓展讨论了语音的情绪识别。声纹识别部分又分为说话人辨认和说话人确认两个任务,而语音情绪识别将直接处理为一个多分类的问题。为了利用不
随着人工智能技术的发展,在未来智能时代,人机交互将如同人与人交互一般。要实现这种交互方式,语音识别技术是机器所必须掌握的技能。因此在人工智能的发展历程中,对语音识别
近年来,中国一些优秀的传统剧目在国外大受欢迎,吸引了众多外国艺术家,剧团和普通观众通过各种渠道了解和学习中国戏剧,也由此带来有关戏曲翻译的大量需求。但是,由于中外文化、历史和语言的差异,戏剧翻译还是有很多的困难。中国传统戏剧有其独特的表演体系。行当,唱腔和戏剧道具名称等许多特有的文化词汇都需要尽可能完整地表达。本文旨在通过周贻白《中国戏剧史》第八章的翻译实践,总结出戏曲术语翻译面临的挑战和应对的方
《电影新技术的魅力》(Cinematic Appeals:The Experience Of New Movie Technologies)该书作者以学术研究的视角讲述数字技术在电影制作发展史上发挥的重要作用,通过列举不同风格的影片,以时间发展为线索,讲述新数字技术对好莱坞电影风格及大众审美变化的影响。该书引用影视专业术语较多,语言较难理解,专业跨度大,在翻译过程中困难较多。本翻译实践报告主要分析
本文翻译文本摘自阿里埃勒·罗杰斯(Ariel Rogers)电影和文化系列丛书中的其中一部:《电影新技术的魅力》的第五章。此文本围绕3D电影技术展开讨论和说明,其内容涉及众多3D电影术语,专业性很强,因此,本文的重点及难点就在于这些电影相关术语的翻译。本文将术语分为已规范术语和未规范术语,在翻译这两大类术语的实践中探讨术语翻译策略的选择。在翻译己规范术语时,译者合理使用工具书、专业词典、专业网站;