细粒度评价对象抽取关键技术研究

来源 :中国科学院大学 | 被引量 : 0次 | 上传用户:abcoabco1
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着社交网络(包括评论,博客,论坛等等)的兴起,无论是个人还是团体都存在着利用这些信息来做决策的需求。但是,由于网络上的信息太多,人们的个人能力无法解决这项任务,自动化的情感挖掘(Opinion Mining)的任务正是由此而产生的。  虽然在近几年有很多的句子级别([1][2][3])或者篇章级别([4][5])的研究和应用,也取得不错的效果,但是这还远远没有达到人们预期的效果。一篇正面评价的文章并不等价于作者对于该对象的所有方面都是正面的评价,反之亦然。所以,我们需要将评价的粒度继续缩小,缩小到对象级别,称之为基于对象的情感挖掘,主要包含三个子任务:识别抽取文本中的主体、评价对象抽取、判断对于每一个评价对象的情感极性。  本文的研究集中在评价对象抽取,我们调研了目前主流的两类方法:基于规则和基于序列标注模型的两类算法。因为基于规则的局限性,本文主要研究了基于序列标注模型的算法,主要的研究内容包括:传统序列标注方法的实验、深度学习模型的使用与改进以及模型融合三方面,主要的贡献包括:  通过研究序列标注问题以及算法,实验说明深度学习在解决序列标注问题上更有优势。本文对比了隐马尔科夫模型(HMM),最大熵马尔科夫模型(MEMM)、条件随机场(CRF)和循环神经网络(RNN)在序列标注问题中的应用效果,发现使用RNN确实能够取得较好的效果。  通过修改网络结构来改进现有的RNN模型。本文通过引入CRF Layer以及改变网络结构的方式对RNN模型进行优化,并取得了较好的效果提升。同时,本文设计的网络结构,在通用性和准确率上都优于现有算法。  最后采用模型融合的方式,将传统的序列标注的方法和神经网络算法的结果相结合,进一步提高了算法的分类准确率。
其他文献
神经网络的学习方式通常包括三种:监督(supervised)学习、无监督(unsupervised)学习和强化(reinforcement)学习。由S.Grossberg和G.A.Carpenter等人提出的自适应谐振理论(Adap
由于企业、政府和其他组织的工作越来越依赖于计算机网络系统,保护这些系统免受攻击已成为当务之急。随着互联网计算机的不断增加,IDS显然已成为必不可少的重要手段。 入侵
最近几年,卷积神经网络技术在许多视觉应用中都取得了成功,目前大部分成功的物体分类系统都基于深度卷积神经网络框架。对于控制计算机平台来说,近年来随着技术的不断进步,移动控
随着我国道路交通的不断完善,机动车辆日益增多,各行业为了实现和改善对机动车辆的监控和管理,对车辆监控系统提出了更新更高的要求。基于这样的需求背景,我们研究了各种相关技术
随着Internet及全球信息网应用的快速发展,Web应用正逐步走向企业级计算,其复杂性和动态性的要求更高。纯静态web页面已远不能满足用户和开发者的需求,满足用户动态请求,页面内容
进入二十一世纪后,信息呈现爆炸式地增长,数字信息化的加深使得数据的重要性日益提高,企业对存储系统的备份与恢复功能提出了越来越高的要求,快照技术因其快速的即时备份,且生产副
N-糖基化作为一种普遍的蛋白质翻译后修饰,对生物功能有着重要的调控作用。随着质谱技术的发展,人们基于实验分析及文献报道构造了各种格式不一的糖库。然而,自然界中可能仍存在
中国高等院校在科学技术的研究与开发方面已经有了长足的发展,科技工作的发展以及日益激烈的科技竞争使得高校科技管理工作面临新的挑战.同时,我们也看到,校园网建设的进展以
软件内建自测试摈弃了传统的独立的手工测试方法,提出在软件开发过程中通过模板与程序开发人员交互得到有用的测试信息并将其保存在模板中,然后编写程序自动从模板导出测试用
随着移动互联网时代的发展,室内定位的市场需求越来越强烈。传统的室外定位技术不能满足室内定位对于精度的要求,越来越多的室内定位技术和算法被相继提出,其中基于接收信号强度