基于卷积神经网络的隐式篇章关系识别模型

来源 :厦门大学 | 被引量 : 0次 | 上传用户:rg595091068
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
篇章关系表示两个文本单元之间的逻辑关系。隐式篇章关系因为其识别难度大,并在自然语言中所占比例高等原因备受关注。在隐式篇章关系识别中,句子的语义信息、信息焦点、语法信息和抽象特征都起着重要的作用。基于特征表示的学习方法难以获取信息焦点,并且构建成本高。因此本文利用卷积神经网络学习抽象特征的特性构建一个全新的隐式篇章关系识别模型,该模型能够学习语义信息、信息焦点、抽象特征等对隐式篇章关系识别有着重要影响的信息,因此能够提升模型识别效果。实验表明该模型在PDTB数据集上提升了 4%左右。本文主要研究工作包括以下几个部分:(1)研究基于传统特征组合方式和词向量表示方式的模型。利用经典的特征组合实验作为本文的baseline,并探索不同词向量和词向量维度对模型的影响。(2)探索几种句子模型的识别效果。分别提出了基于词袋模型、序列化模型和树状模型的隐式篇章关系识别模型,研究发现语义信息、语法信息和信息焦点对隐式篇章关系识别有着重要的作用。单独使用具有特定信息的句子向量的模型效果不佳,因此还需要加入额外的信息如特征、词向量以提高模型效果。(3)提出基于卷积神经网络的隐式篇章关系识别模型。模型结合了双向的长短记项记忆(Long-Short Term Memory,LSTM)、卷积神经网络和 K-Max Pooling的优点,构建一个能够学习语义信息、信息焦点和抽象特征的模型。该模型比前人工作结果提升了 4%左右。
其他文献
切换系统是一类典型的混杂系统,由于其在现实生活中有着十分广泛的应用,已经成为了控制领域的研究热点,并且涌现出许多优秀的研究成果。但是,在切换系统的实际应用场景下,还
如今,随着计算机技术的快速发展,商用级电脑变得无处不在。无论是在政府机构、军事系统,各类公司还是学校,都有它的身影。随着商用计算机在社会生产活动中的广泛应用,人们的
毛竹(Phyllostachys edulis)是重要的亚热带经济林资源,其具有固定森林土壤有机碳和减少温室气体排放的优势。普通尿素施用会增加土壤温室气体的排放,而生物炭施用对降低土壤
在现实生活中,人们可以很容易地获取大量的数据,但是通常其中大部分数据是没有样本标签的。传统的监督学习算法仅使用少部分有标签的数据进行训练,由于训练样本规模小,信息不
相关向量机(Relevance Vector Machine,RVM)是一种基于稀疏贝叶斯理论的机器学习算法。该算法十分擅长处理小规模数据问题,由于其优秀的表现,已经应用于图像处理、故障诊断等
由于化石燃料的过度使用,导致了能源危机和环境破坏。可充电金属-空气电池和全水裂解已被视为替代化石燃料的绿色能量存储和转换装置。但是,但缓慢的氧还原(ORR)、析氧(OER)和析
中华蜜蜂在1-18日龄以内时,主要在巢内从事哺育和清理巢房等工作,随着其日龄逐渐增大,在15-18日龄以后,蜜蜂逐渐开始从事采集工作。当蜂群中没有足量的采集蜂时,部分年幼的哺
作为治疗癌症的一种新型治疗方式,利用免疫系统研发出更为有效的治疗策略,对现代医学具有深刻的意义.基于此,这就要求我们需要更好地理解肿瘤微环境对癌症细胞和免疫反应之间
背景:减重手术能够有效改善病态肥胖患者的体重,同时对其代谢性并发症如高血压也有一定的治疗作用。近年来有研究发现减重手术对原发性高血压患者以及大鼠也有一定的降压作用
左心耳是人体心脏中重要的组织结构之一,它与左心房相连,血流相通,内部分支纵横交错。左心耳的性状变化与心脏疾病密切相关,左心耳图像的分割是对左心耳进行分析的重要步骤之