基于多任务学习的情感分析技术研究

来源 :华南理工大学 | 被引量 : 0次 | 上传用户:lzltgp
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
现有的情感分析方法主要分为基于情感词典的情感分析方法和基于机器学习的情感分析方法,而在基于机器学习的方法中,基于深度学习的方法最为流行。基于情感词典的方法十分依赖情感词典的质量及覆盖度,而基于深度学习的方法需要大量的标注数据集。在数据集较小时,基于深度学习的模型容易产生过拟合,多任务学习技术同时对多个任务进行训练,通过利用相关任务中的领域特有信息来提升模型的泛化能力,在一定程度上缓解了过拟合问题。本文对主流的多任务学习技术进行研究后发现以下几个问题:(1)现有多任务学习模型多使用基于LSTM的模型进行情感分析,并使用单层LSTM的最后一个隐藏状态作为文本的隐含特征,这一方法特征提取能力有限且存在有偏表示问题;(2)在文本包含多个情感词且语法结构复杂的情况下,现有方法无法准确识别出整个句子的情感倾向;(3)LSTM由于其循环特性,当前时间步的输入依赖于上个时间步的输出,其并行效率较低,很难完全发挥出GPU的性能;(4)现有多任务学习模型将特征空间分为私有和共享两部分,每个任务都拥有一个独立的私有空间,其内存消耗与任务数量呈线性关系,在任务数较多时十分耗费内存。针对以上问题,本文进行了以下几个方面的工作:(1)本文使用多种方法对ASP-MTL模型进行优化,并提出基于注意力机制的多任务情感分析模型AASP-MTL。这一模型拥有较强的特征表示能力,不仅可以解决LSTM中存在的有偏表示问题,还提供一种可视化分析方法,可以对模型进行更为直观的分析;(2)针对现存的第2个问题,本文将基于情感词典的方法结合到多任务情感分析模型中,利用基于情感词典的方法的优势来解决这此问题;(3)针对于LSTM并行效率差,且现有多任务模型耗费内存的问题,本文提出基于DT的多任务学习模型DT-MTL,此模型有着极高的并行效率和内存使用效率。本文在16个不同领域的情感分析数据集上进行实验,结果表明:在情感分析性能上,AASP-MTL的平均错误率要要低于ASP-MTL模型,DT-MTL模型的平均错误率低于ASP-MTL模型但略高于AASP-MTL模型;在模型并行性能上,DT-MTL模型要远高于AASP-MTL模型。在数据量较小时,使用AASP-MTL模型可以得到较高的情感分析性能,而在数据量较大时,使用并行效率更好的DT-MTL模型可以缩短训练时间。
其他文献
突发性外伤的地区性综合性流行病学资料的文献较少见。本文分析了突发性外伤,结果提示;在本地区 ,预防突发性外伤应以机器伤和汽车伤为主,对生活意外伤也不以忽视;本组病例中汽车
<正>《国务院国资委关于以管资本为主加快国有资产监管职能转变的实施意见》(114号文件)是继《国务院国资委以管资本为主推进职能转变方案》之后,在完善国有资产监管体制机制
生物时间系列的统计分析十分复杂,最常用的方法即是余弦法。其基本公式为: Yi=M+Acos(Wti+φ)+ei。通常使用三种余弦法以处理不同的数时间系子)数据:①单个余弦法,适用于单个
本改造方案是在保证酒钢原-高速线材生产产品的基础上,利用现有厂房、起重运输设备、钢坯上料加热设备、部分轧钢设备及公用辅助设施,在线材生产线上增加一条高速直条棒材生产
为落实国网公司提出的“全能型”供电所建设任务,国网池州供电公司根据国网安徽省电力公司的统一布置,在贵池墩上供电所开展了“全能型”供电所试点建设。在实施过程中公司勇
泛动画概念的出现是数字时代的产物。它突破了传统动画的艺术范畴,向社会应用实践领域延伸。动画的这种机制变化,使得现实世界具有了应用性审美的价值维度。在这过程中,仿像
第一次全国地理国情普查于2015年完成并在社会建设多个领域取得了广泛应用,按照国务院对地理国情监测工作总体部署和测绘地理信息事业转型发展需要,从2016年起地理国情信息获
在开放和改革不断朝着更高层次发展的国际形势下,中国做出的选择是顺应了全球经贸发展新趋势,对于我国全面深化改革和扩大开放、以开放促改革促发展,探索新途径意义重大。$$
报纸
人工智能目前已经渗透至各个领域,大学生思想政治教育工作也不例外。人工智能的发展对当前大学生思想政治教育工作既带来了新的机遇,也带来了较大的挑战。思想政治教育工作者
在体育教学过程中,发现学校体育的发展遇到了一个困难:学校体育的安全现状堪忧。为了保证学校体育的安全,学校体育不断降低体育难度,使得一些难度稍高的体育项目淡出了学生的视野