汉语动宾搭配识别研究

来源 :大连理工大学 | 被引量 : 0次 | 上传用户:vicky01255
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
句法分析已经成为当前自然语言处理研究的重点和难点。面向依存文法的句法分析方法主要是通过获取句子的核心动词及其所支配的词语搭配,进而分析句子内词语之间的依存关系,以建立依存句法树。动宾结构在SVO型语言里是很常见的,是句内的核心成分,处于优势地位,映射了整个句子的轮廓。识别出动宾结构,就可以在此基础上,从动词出发,向左搜索各种状语,逼近句子的主语成分:从宾语出发,向左搜索各种修饰成分,逼近动词,或向右搜索其他成分。从而为实现完全的句法分析奠定一定的研究基础。本文主要对基于语料库的动宾搭配识别方法进行研究。首先,在研究统计方法识别动宾搭配的基础上,针对统计方法识别错误,引入语言学知识,采用一种基于词性语义约束与统计结合的方法对动宾搭配进行识别研究。其次,根据动宾搭配识别特点,将动宾搭配识别问题转化为序列标注问题,采用在序列标注上的有良好表现的条件随机场(CRF)模型,对动宾搭配进行识别研究。对180万词次真实语料,随机抽取5个体宾动词进行实验,结果表明基于词性语义约束与统计的识别方法比单纯利用统计识别方法,正确率、召回率、F值有很大提高:基于CRF的方法很好的融合了上下文信息,正确率、召回率、F值分别达到了90.78%、86 18%、88.42%。
其他文献
在多机器人系统的研究中,多移动机器人系统的协调合作始终是一个热点,也是该领域中一个基础性的研究方向。机器人足球系统是典型的多机器人协作系统,是研究多机器人协作问题
耐维-斯托克斯(Navier-Stokes)方程是早在18世纪就已经发展完善起来的一套对流体行为进行精确建模的偏微分方程组,描述了流体内部速度和压力的变化及其相互关系。本文以此为
现场总线控制系统已逐渐发展成为继集散控制系统(DCS)之后的新一代控制系统,成为当前控制领域内的热点之一。在众多的现场总线标准中,过程现场总线(PROFIBUS)标准以其国际化
基于内容的图像检索(CBIR)是计算机视觉和其它计算机科学领域的研究热点,但图像的低层特征与高层语义之间的巨大语义鸿沟束缚了CBIR的发展。基于支持向量机(SVM)的相关反馈机
供应链批量问题在管理库存和节约成本方面做出了出色的贡献。由于需求等大量的影响因素受市场环境等条件影响波动较大,会出现各种难以预料的变化,通常会导致不能够得到准确的预期效果,因此基于模糊机会约束规划的联合补充问题就因此产生。模糊机会约束规划的联合补充模型中,需求被作为模糊变量来处理,使得整个问题模型可以简化为一个相应的数学模型,然后问题的核心转换为对该模型的求解。而对于求解模糊机会约束规划的联合补充
数据网格是网格环境下共享和管理存储资源和分布式数据资源的大规模、可扩展架构,它适应数据密集型应用对网格环境下数据共享和处理的需要,给用户提供了透明访问远程异构数据资
组播技术是一种群体通信的手段,是目前网络中研究最多,应用最广的一种通信方式,它要求信息从一个源节点同时发送到多个目的节点。路由作为多媒体网络的核心技术,其研究范围比
随着移动通信网络的发展,数据传输速率的提高以及带宽的增加使得无线环境下视频的传输成为可能。但视频数据量非常庞大,而为移动服务所付费用又与无线链路上传送的数据量成正
离群点挖掘包括离群点检测和离群点分析两个方面,是数据挖掘中的一个重要部分。为有效的检测出离群点,研究人员开发了大量的离群点检测算法。如:基于统计、基于距离、基于密
活动多实例模式是一种重要的工作流模式,定义多实例活动可以大大简化工作过程的定义。多实例活动可以从整体上表示群体执行同样任务的情况,将活动多实例应用于工作流管理系统