基于深度神经网络的情感分析迁移学习方法研究

来源 :湖南大学 | 被引量 : 0次 | 上传用户:wanmei_zxn
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
情感分析在社会实际应用中非常广泛,比如应用于舆情分析、电商购物网站的商品评价分析、旅游网站中对旅游景点的评价分析等。通过情感分析可以将被分析的对象,比如某款商品、景点等的各方面优劣都呈现给潜在的顾客或者游客,以帮助他们更全面的做出决策。然而使用机器学习方法进行情感分析研究时,对训练数据具有严格的要求,一是训练数据和预测数据需要满足独立同分布假设;二是要有大量的具有标签的训练数据,且类别要较为平衡。然而现实世界中的数据经常存在不满足独立同分布的假设,而且数据类别非常的不平衡。针对以上问题,本文提出了两个基于深度神经网络的迁移学习方法来提升情感分析的性能。本文提出了一个基于序列迁移学习方法的情感分类框架,它包含了一个基于迁移学习的降采样方法和基于卷积神经网络的级联分类结构,能够很好地解决非平衡数据集的情感分类问题。统计机器学习方法使用向量空间模型对自然语言进行建模,这使得语句丢失了顺序关系和上下文依赖关系,同时对于一词多义的词语也无法作区分性表示,因此在样本重采样和模型学习时存在较大困难。经实验验证,本文所提出的分类框架在极度不平衡的真实旅游景点情感评论数据集的少数类上的精确率、召回率和f1值均有良好的表现,分别达到了63%、64%和63%,比模型BalanceCascade和Multi-model Fusion分别高12和5个百分点。本文针对现有情感分析数据集标签的形式提出了一个联合三分类任务和回归任务的多任务学习模型,可以在学习情感极性的同时学习情感强度值,充分利用了训练数据提升情感分析模型的性能。该模型同时使用词嵌入和字嵌入两种词向量作为输入层,分别使用双向LSTM和双向GRU提取语义特征,然后使用自注意力机制重新分配特征的权重系数,并且使用全局最大池化操作提取所有特征的最大值语义信号,最后连接一个全连接层。经实验验证,本文提出的多任务学习模型在数据集MinChnCorp中的二分类宏平均f1值达到94.48%,比多模型融合的LR all和深层卷积模型CCB分别高3.5和2个百分点。
其他文献
目的 探讨综合康复治疗对脑瘫伴运动性障碍构音患儿的治疗效果.方法 28例患儿在正规的运动训练同时,以构音障碍检查法为基础进行言语训练.结果 经过1—3个疗程的综合康复治疗
期权定价模型高效数值解法的研究具有重要的科学意义和应用价值。本学位论文针对支付红利的期权定价模型(线性Black-Scholes方程),提出模型的分组显式方法:三点组显式(GE-3)
幼儿的语言能力是在交流和运用的过程中发展起来。应为幼儿创设自由、宽松的语言交往环境,鼓励幼儿交流,让幼儿想说、敢说、会说。
20世纪90年代以来,各公司的发展战略已从多元化经营转变为归核化(Refocusing)战略,把公司的业务归拢到最具竞争优势的行业上;把经营重点放在核心行业价值链中优势最大的环节
高血压既是独立的心血管疾病,又是脑卒中和冠心病等多种慢性非传染性疾病的主要危险因素,而脑卒中发病率、死亡率、致残率很高,是造成心脑血管病死亡的主要原因之一。我们对
通过分析镀锌工艺对冷轧基板的要求,制订了生产高质量冷轧镀锌基板各重点工序的质量控制,使唐钢最终生产出了满足镀锌要求的冷轧基板。
在我从事初中化学的多年时间里.很多同学反馈的信息说化学学起来很难,我感到非常奇怪。难吗?我经常这样问自己.是不是学生对化学这门儿学科认识有误?在现实生活中流传着这样的俗语