基于深度学习的跨语言文本情感分类技术研究

来源 :华侨大学 | 被引量 : 0次 | 上传用户:loveqin11
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网技术的飞速发展,人们越来越热衷于在网上发表自己对某一事件或者事物的看法,这些评论背后隐藏着巨大的商业价值,所以近年来文本情感分析越来越引起人们的关注。但是一些语言较其他语言起步晚,缺乏高质量的语料资源,人工标注又需要投入巨大的人力物力资源,这在一定程度上阻碍了其文本情感分类技术的研究。跨语言文本情感分类任务就是利用语料资源丰富的一种语言,辅助另一种语料资源匮乏的语言实现文本情感分类。为了进一步提高跨语言文本情感的分类性能,本文做了多方面的融合和改进,提出了以下跨语言文本情感分类方法:(1)针对传统的单语言词向量表示方法不能很好地进行双语交互学习这一问题,提出了一种对抗长短时记忆网络的跨语言文本情感分类方法。该方法设置源语言和目标语言独立的特征提取网络以及双语共享特征提取网络,建立源语言和目标语言的联系,减少双语之间的语义鸿沟。同时,在共享特征提取网络中,设置语言分类器进行对抗训练,使分类器尽可能分不清特征是来自源语言还是目标语言,以获得双语的不变特征,从而使双语之间达到更好的知识迁移效果。相比较之前的研究方法,这种方法既保留了双语各自独立的特征,又可以获取到双语的不变特征。在NLPCC 2013跨语言文本情感分类公开数据集上做了实验,实验结果表明该方法提高了跨语言文本情感分类性能。(2)考虑到情感词典依旧是不可忽略的资源,以及情感词上下文信息对整段语料的情感极性贡献较大这一因素,提出了一种结合局部和全局特征的跨语言文本情感分类方法。该方法结合情感词典,利用卷积神经网络获取情感词上下文特征,将其作为整段语料的局部特征。同时,利用加入注意力机制的双向长短时记忆网络获取整段语料的全局特征。最后,将局部特征和全局特征进行拼接融合作为最终的分类特征,输入到分类器进行文本情感极性分类。在包含多语言的数据集上分别做了实验,实验结果表明该方法可以提高跨语言文本情感分类性能。
其他文献
当前我国政府财政部门预算正处于转型期,因此如何深化部门预算改革已是当务之急。本文通过介绍我国的财政预算现状,指出现在部门预算存在的主要问题。然后通过讨论美国新绩效
交际过程中使用的称谓语,除表示对交际对象的直接称呼或他称称谓外,还往往蕴含着亲昵、警告、威胁、戏谑或讽刺等言外之意,或表示尊敬、提出请求、传达喜恶等话中之情。因此,
德育实践课程是伴随着课程观念现代化而产生的一种新型的德育课程形态,把德育实践课程内容进行系统设计开发,已经成为现代德育科学发展的新趋势,更符合现代德育活动的本质和
中国情景下新生代员工自我认同维度的构建,有利于新生代员工的管理。本文是质性研究,通过访谈法、类属分析和德尔菲法等对中国新生代员工自我认同的维度进行研究。最终得出以
TZM钼合金是目前应用最广泛的高熔点合金之一,在航天、军工以及核工业等领域有着广泛的应用。传统的TZM合金制备过程中需要昂贵的模具,工艺非常复杂,成本较高,还难以制备形状复杂的三维零件。电子束熔丝沉积工艺可以很好的解决这一问题,其具备能量输入大,沉积效率高,真空洁净度好,可直接成型复杂零件等特点,在难熔合金直接成型方面有着独特的优势。本文采用电子束熔丝沉积工艺制备TZM合金,研究了不同工艺参数下(
近年来,云计算的发展使数据中心网络的流量呈现出爆炸性增长趋势,需要更灵活的网络管理和网络维护机制。与此同时,SDN数据中心网络应运而生。SDN高度集中的控制能力简化了数
目的:探讨高脂血症性急性胰腺炎的临床特征、治疗及转归情况。方法:回顾性分析本院收治的32例高脂血症性急性胰腺炎患者的临床资料,随机选择同期住院的非高脂血症性急性胰腺
目的:分析综合护理干预在改善慢性胃炎和消化性溃疡患者生活质量中的价值。方法:选取本院2013年2月-2014年2月收治的240例慢性胃炎和消化性溃疡患者作为研究对象,按照随机数
应用计算熔解温度的方法,探索应用该方法设计新型基因探针的可能性.利用荧光检测技术进行靶DNA与错配DNA链的鉴别,从而研究了DNA熔解温度对设计新型基因探针的影响.
目的:探讨胸腺法新联合吉西他滨治疗晚期胰腺癌疗效。方法:收集本院收治的胰腺癌患者50例,将患者按随机数字表法分为治疗组和对照组,每组25例。对照组患者采用吉西他滨单药化