基于域对抗网络的跨领域文本情感分析

来源 :桂林电子科技大学 | 被引量 : 1次 | 上传用户:jsrgchf
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着web2.0的发展,互联网深入人们生活的方方面面,同时为人们提供了更加方便和宽广的信息交流平台。越来越多的用户在社交平台上表达自己的想法,在购物平台上阐述自己对产品的使用看法,在新闻平台上发表个人观点,由此产生了大量包含用户观点信息的文本数据,因此分析这些文本数据的情感极性也就有了很重要的价值。情感分析又称意见挖掘,是对网上各种新闻资源、社会媒体评论和其他用户生成内容的进行分析、处理、归纳和推理的过程。文本情感分析是情感分析算法的一个分支,典型的监督分类算法都适用于文本的情感极性分析。然而,当训练数据与测试数据不属于同一个领域的时候,传统的分类方法的预测效果就变得很差。通常是因为源领域有强烈情感性的特征在目标领域可能不再具有这些特征或是呈现其他情感极性,为了将源领域的特征泛化到目标领域特征中,并对目标领域进行情感分析,跨领域情感分析成为了解决方案之一。跨领域情感分析方法当前主要关注用特征提取器提取多个领域之间的共享情感特征。其中利用深度学习中特征提取网络优秀的特征提取能力提取不同领域之间的共享情感特征,再利用共享情感特征进行情感分析是当前跨领域文本情感分析的主要研究方向。目前深度学习方案中主要利用自编码器和域对抗实现共享情感特征的提取,因此本文主要优化改进域对抗能力以及利用深度学习中的各种不同的网络结构提取句子中的语义信息,最后将提取出来的不同领域文本中的共享情感特征用于文本情感分析。本文的主要研究内容,及创新点如下:(1)由于不同领域之间的特征不同,使用以往的域对抗方式容易出现梯度消失和梯度爆炸,并且提取的特征泛化能力差的问题。本文通过提出基于Wasserstein距离的域对抗方式,然后结合正交约束来更好地提取领域深层共享特征,同时在整体网络结构上使用降噪自编码器,使得特征提取器能够提取出鲁棒性更强的领域共享情感特征。(2)针对以往特征提取方式提取的共享情感特征中缺少句子语义信息等问题,本文使用BERT模型获取句子中的语义信息,再借助卷积神经网络对提取的特征进一步的特征选择以及特征降维。然后借助域对抗机制混淆源领域和目标领域的特征,同时利用源领域含标签的数据训练情感分类器。最后在亚马逊公开数据集上的对目标领域情感极性进行预测,并且取得了较好的预测结果。
其他文献
<正>【习作提示】写童年趣事。写之前,可以借助童年生活的照片打开记忆的闸门,也可以和爸爸、妈妈或小伙伴一同回忆……要把事情经过写清楚,写出自己的真实感受。写完后,把习
近日,我国科学家提出了一种无人驾驶平行智能测试模型,为解决无人驾驶汽车理解复杂的交通场景这一难题提供了新思路。该研究由中科院自动化研究所与清华大学、西安交通大学等
"情境-问题"教学一直以来受到少数民族中学数学教师的青睐,因为它可以有效增强中学生对数学问题的理解能力.文章以国内外学者研究理论为依据,就如何在少数民族中学开展"情境
在互联网时代,在市场经济转型的需求下,工业经济、金融资本与互联网经济紧密融合,新的互联网商业模式、市场新常态和新兴产业迭出,现有的企业管理发展模式面临极大的挑战和冲
<正>中信出版社2016年6月内容简介:中国经济已经进入新常态:经济增长从高速转向中高速,人口结构也开始迈向老龄化,消费对经济的贡献越来越大,但产能过剩与有效供给不足并存的
对真空管式复合抛物面太阳能集热器的传热模型进行了分析,在总热损失系数、效率因子、热迁移因子和瞬时效率表达式的基础上,建立了有盖板带翅片的复合抛物面集热器性能预测模
作为实证社会学与理解社会学的代表人物,迪尔凯姆与韦伯的社会学方法论开启了社会学学科的独特思维,通过对二者方法论的理论基础、社会学研究对象的界定、观察对象的方式和解
为了提高镀锌钢的耐蚀性能,以氟锆酸钾、乙酰苯胺为成膜物质,在镀锌钢表面制备了氟锆酸盐/乙酰苯胺有机无机复合转化膜。采用扫描电子显微镜(SEM)、能谱仪(EDS)、傅里叶变换
目的:探讨乙肝肝硬化及其中气虚血瘀证患者轻微型肝性脑病(MHE)发病情况及影响因素。方法:选取114例乙肝肝硬化患者,另取健康者100例为对照,探讨乙肝肝硬化及其中气虚血瘀证
【正】 对家庭这个人类生活的组织形式应下一个怎样的定义?我认为,家庭定义应包含三大基本特征。第一,家庭是一个历史范畴。首先,家庭不是从来就有的,而是在人类社会一定发展