语义角色标注及其在句子相似度计算上的应用

来源 :北京邮电大学 | 被引量 : 7次 | 上传用户:ccbone
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在中文信息处理中,语义角色标注和句子相似度计算都是基础而又重要的工作。语义角色标注是为句子中谓词论元及附属成分标上其担任的语义角色,如施事、受事、时间和地点等等。汉语语义角色标注的研究才刚刚起步,可利用的资源还很有限。为此,本文采用半监督机器学习方法,以期在资源有限的情况下能取得比较好的标注性能。句子相似度计算就是比较句子之间的相似程度,在过去的研究中,对语义角色框架信息的利用不够,本文希望通过挖掘句子的语义角色框架的信息,来提高句子相似度计算的性能。基于以上考虑,本文的工作主要分为以下三个方面第一,实现了一个半监督语义角色标注方法,系统分三个步骤进行语义角色标注,首先确定句子的目标动词及对应的论元;其次,确定句子的候选语义角色框架;最后从候选语义角色框架中确定每个论元对应的语义角色。实验表明该方法性能良好。第二,为了改善系统的性能,还单独研究了未登录名词的自动语义分类问题,并将未登录名词自动分类模块应用到语义角色标注算法中,实验表明,未登录名词自动分类模块的加入有助于语义角色标注性能的提高。第三,在语义角色标注取得良好性能的基础之上,本文尝试将语义角色标注的结果应用到句子相似度的计算中,在这过程中,还研究了词语相似度的计算,最后将语义框架相似度、词语相似度等特征作为句子相似度计算的特征项进行综合。实验表明,语义角色框架信息有助于提高句子相似性的识别。
其他文献
工业以太网以其低成本、高传输速率、开放性好的特点,在工业控制领域得到了越来越广泛的应用。传统的工业以太网往往依据生成树协议构建的网络拓扑来应对网络结构变化,但是由
进入海洋经济时代,各国对海洋资源的探索和开发逐渐扩展至深海区域,对海军舰艇编队协调、动力追踪救援等新功能的要求日渐明确,船舶推力系统的工作性能受到了更高要求的挑战
实际工业生产过程中常常含有非线性、滞后环节,特别是在化工、冶炼等生产过程中尤为显著。连续搅拌釜式反应器(Continuous stirred-tankreactor,CSTR)是生产聚合物时用得最广
微处理器系统是目前医学检验仪器的主要发展方向,引入高性能DSP控制器和嵌入式系统技术则更加有利于提高测量、控制性能和人机界面管理水平。 本文结合典型智能医学检验仪
压电变压器(Piezoelectric Transformer,以下简写为PT)是一种通过机械振动来传输能量的新型电子器件,具有功率密度高、体积小、电磁噪声小、输入和输出端口的电气隔离性能好、成本低和便于批量生产等优点,因此,有很好的发展前景。与之相关的功率变换器的新技术研究也逐渐成为热点。PT功率变换器同样具有体积小、效率高、噪声小、电磁兼容性好等优点,成为绿色电源领域一股新的动力。论文主要完成
等离子点火是一种新型的点火技术,它是利用等离子发生器产生的高温等离子射流使得煤粉热解、气化、燃烧,然后再点燃多级燃烧器中的煤粉,最终点燃锅炉中煤粉流。电站锅炉在启动和
二十世纪80年代以来,用数字化混沌系统构造密码系统受到了越来越多的关注。混沌理论与密码学之间存在着千丝万缕的联系,混沌系统的动力学特性满足密码系统的某些安全性能需求
四旋翼无人飞行器(Quadrotor Unmanned Aerial Vehicle,UAV)是一种性能可靠、结构简单的可垂直起降的无人飞行器,具有缓速飞行、悬停、控制灵活等固定翼飞机无法具备的优势,
三维物体形状检测与重构技术是计算机视觉和计算机图像图形处理相结合的一个研究方向,此技术在生产自动化、机器人视觉、CAD、工业检测、虚拟现实和医学等领域有着广泛的应用
随着控制理论和电子技术的发展,工业控制器的强适应能力和高智能化正逐步成为现实。其中以单片机为核心实现的数字控制器因其体积小、成本低、功能强、简便易行等特点而得到广