基于深度学习的评论文本情感分析

来源 :南京信息工程大学 | 被引量 : 0次 | 上传用户:windlam
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
情感分析是自然语言处理中的一项基本任务,在情感分析任务中,文档级情感分析是较为常见的方式。当下各种现代化技术不断更新,各大电商平台中出现大量用户评论,通常能体现用户的情感倾向和个人喜好,所以当下学者们热衷于对评论文本进行情感分析。而在评论网站中用户信息和产品信息是重要的数据,如何将用户信息和产品信息融入到情感分析模型中是一个热点问题。本文的核心研究内容就是利用深度学习的方法,针对评论文本构建融合用户信息和产品信息的文档级情感分析模型。主要工作如下:(1)为了能够更有效地捕捉文本特征,同时能够将用户信息和产品信息融入到情感分析模型中,本文提出了基于自定义词嵌入-双向长短期记忆网络-注意力机制的模型。该模型首先将用户信息和产品信息融入到词嵌入模块中,然后结合双向长短期记忆网络和注意力机制网络层捕捉文本特征和语义关系,实验证明本文模型具有一定的有效性。(2)为了能够在模型中以更多元的方式融入用户信息和产品信息,本文提出基于深度双向长短期记忆网络-自注意力机制-自定义分类器的模型。模型首先通过深度双向长短期记忆网络来识别上下文词义联系和获取文本深层特征;然后利用自注意力机制捕获文本中重要的特征。该模型最后结合用户信息和产品信息构建自定义分类器模块,利用上下文感知注意力机制为用户信息和产品信息配制特定参数,该模型在公开数据集上的性能较目前常见的模型而言均有提高。(3)为了能更好的提取评论中包含的词粒度、句粒度和篇章粒度的文本信息,本文提出一种基于注意力交互机制的层次网络模型。该模型利用层次网络对不同粒度语义信息进行提取,并在注意力交互机制中结合用户、产品中的重要信息来帮助提取文本特征。最终将用户视角下的损失值和产品视角下的损失值作为辅助分析信息,并利用层次网络输出的针对用户或产品的关键文本特征进行训练和分析。该模型在公开数据集上的性能较目前常见的模型而言有所提高。
其他文献
吴镇(1280—1354)字仲圭,号梅花道人、梅花和尚、梅沙弥等,元嘉兴魏塘(今属浙江嘉善)人,与黄公望、王蒙、倪瓒并称"元四家"。吴镇不仅是一位杰出的画家,还是一位著名的隐士。从明正德到清光绪的各个版本《嘉善县志》中,都把吴镇放在人物志"隐逸"篇中来记载,而与吴镇同时期的画家盛懋、张观等人则被记录在"艺术"篇。在古代,"隐逸"是高士追寻大道的方式,而"艺术"则泛指各种技术技能,属于工匠的"
期刊