汉语句法成分中心词自动识别方法的研究

来源 :第五届全国青年计算语言学研讨会(YWCL 2010) | 被引量 : 0次 | 上传用户:hangxujie
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文提出一种基于层叠条件随机场的统汁和规则相结合的句法成分中心词自动识别的方法。首先将输入的—个标有句法成分的句子分为底层组块和高层短语,分别对这两部分训练两个不同的模型,并逐层进行中心词识别;然后通过规则库和实例库分别进行后处理;最后将这两部分的识别结果进行合并,即得到句子中所有句法成分中心词的最终识别结果。在CIPS—ParsEval-2009评测语料的基础上,本文采用的方法相比于去年本单位采用的方法减少了0.2%错误率。
其他文献
多词语单元识别问题是目前计算语言学的研究热点之一。多词语单元是一个描述相对完整的若干词语组合,包括固定或半固定搭配。在语义块分析系统中,本文采用修改后的C-value方法
会议
西红柿同黄瓜一样,既可作蔬菜烹煮食之,也可作为水果生吃或凉拌食用。而与黄瓜不同的是:西红柿不能吃嫩的、未成熟的。成熟的西红柿才含有它应有的多种营养素。嫩西红柿中缺
期刊
普通话已经走过了近百年的历程,目前还很少有人对普通话的历时语音变化及其韵律特征进行系统的实验研究。本文以2005年颇具代表性的广播电视谈话体语料为基准数据,选取《现代汉
会议
中文信息处理用各种统计方法实现精度的提高,而规则的运用更多是在歧义和未登录词的研究上。蒙古语的统计方法发轫于近几年,但更多的是一种理念的进步,仍是以词干加附加成分的规
会议
生卒年月:1901年6月17日—1971年4月20日终年70岁最高职务:国民党中央组织部部长、国民政府内政部部长★张厉生留法归来,先入CC系,后转投陈诚集团,是陈诚手下得力干将,赴台后
本文根据目前已有的方位词研究成果以及已构建的现代汉语方位词用法词典和用法规则库,初步完成了对现代汉语方位词例句语料库的基于规则的用法自动识别,通过对自动识别结果的分
连词能够连接词语、句子乃至篇章,具有特殊的连接功能,用法复杂多样。目前已有的连词研究成果大都是面向人用的,对连词用法的描述难以避免主观性和模糊性,很难直接应用
会议
排丽旦是个美丽的女子,见过她的人都会这么看;排丽旦也是一个优秀的女人,和她相处过的人都会这么想。维吾尔族女子排丽旦·艾拜都拉在家乡新疆克孜勒苏电视大学教师的岗位上,勤勤恳恳、兢兢业业耕耘了十年,做起了沟通汉语与维语的桥梁。
本文基于TCRF(tree structured conditional random field)模型对汉语框架网(CFN)中的核心框架元素进行了自动标注研究。该方法抽取了依存树中父节点层而的特征,使得
会议
特征选取是用统计方法进行词义排歧的关键。本文通过句法块的分析结果,将主语和宾语、以及主语和宾语在知网中的归类信息应用于目标动词的词义排歧。实验表明,句法特征对于目标