基于语料库的短语结构分析研究

被引量 : 2次 | 上传用户:qq_13439718
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
汉语句法分析是中文信息处理的一个重要任务,通过句法分析可以使计算机理解句子的语法结构,进而指导计算机正确地理解句子的含义。然而当前汉语句法分析的性能并不能满足应用的需求,也严重影响了汉语句子的语义分析。目前汉语句法分析主要借鉴了性能较好的英文分析模型,但并没有达到相应的效果,因此如何结合汉语本身的特点改进分析性能是当前汉语句法分析的一个研究重点。近年来,依据描述汉语本身的语法体系构建的树库推动了汉语句法分析的发展,并有学者根据汉语句子结构的特点,提出了事件描述小句的概念,将句子看作是一个个事件描述小句构成的,将句子的结构分析转化为一个个事件描述小句的结构分析,重新定义了汉语句子的句法结构分析任务,并举办了多次相关的评测。本文就是依据评测的语料库,总结了汉语句法分析的任务,认识到短语结构分析在汉语句法分析中的重要地位,并将其作为本文的主要研究内容。本文对短语结构分析的研究主要集中在如何消除短语结构歧义。本文通过对描述汉语的词组本位语法分析,认为歧义的产生是由于汉语词和短语的功能类型没有准确地反映其句法功能。因此,本文的研究重点就是如何准确确定短语的句法功能,以及如何依据语料库消解歧义。首先,通过对语料库的基本数据进行统计,对真实语言的复杂性有一个基本的认识。在语料库统计数据的指导下,本文以频度10,单中心词,不含非短语成分为标准选择了553个组合模式作为本文的研究对象,其描述了语料库中91.53%的短语实例。其次,考虑到短语的开放,无限的特点,本文采用规则的方式推导短语的句法功能并对短语内部组成成分进行约束,规则中通过复杂特征集可以灵活地表示各种形式的句法语义特征。因此,构建短语结构规则库是本文消解歧义的主要方式,依据规则库构建的特点,本文设计了符合规则编写的长期性,反复性特点的表格记录方式。在短语结构歧义消解方面,本文以语料事实为依据统计了5871个歧义格式,并以“潜在歧义论”的指导思想归纳歧义消解条件。最后,通过对部分存在歧义的短语实例进行歧义消解实验,取得了很好的效果,证明该方法是可行的,有效的。
其他文献
网上教学系统经历了几十年的发展现在已经比较成熟。在学习内容管理系统之前的几种网上教学系统,比如普通资源库系统、学习管理系统和外供电子教学平台等都是在管理员或者教
二聚异丁烯和三聚异丁烯都是有用的化学中间体。本论文研究了多种固体超强酸上的异丁烯齐聚制备二聚异丁烯和三聚异丁烯的反应。首次研究了SO42-/SnO2固体超强酸催化剂上异丁
白居易是中唐时期伟大的现实主义诗人,也是整个唐代留下诗作最多的诗人。《白居易全集》中收录白居易诗歌两千八百多首,而在白氏的这些诗歌里,“饮酒诗”就有六百余首。通过对这
随着经济快速发展和生活水平提高,人们对功能性食品的需求日益增加。但功能因子通常存在水溶性差、对环境条件敏感、易被上消化道破坏、生物利用度低等问题,限制了其在食品中的应用。因此,功能因子的保护及其体内外稳态化研究一直受到广泛关注。其中,pH敏感型功能因子运载体系能够根据人体消化道pH值变化产生显著应答,实现功能因子的定点、定量释放,从而提高其生物利用度。目前,pH敏感型载体材料通常为低毒性合成高分子
多义词的研究是语言学研究中的一个重要课题。多义词是指一个单词具有两个或者两个以上的词义。多义词的词义是怎样联系起来的?不同时期的语言学家给出了不同的答案。传统的语
患者1男性,37岁。因左眼铁片溅入5h于2004年10月4日以左眼“角膜穿孔伤,球内异物”人院。左眼视力0.4,角膜中下方5点处可见裂伤痕迹,无渗漏,瞳孔圆,对光反应存在,晶状体尚清,眼底可见
文章综述了佛教自印度传入中国后,各阶段佛教遗存中弥勒形象的演变,并浅谈其演变体现的佛教世俗化、中国化。
克尔凯郭尔与海德格尔都在做着一种批判传统形而上学的新形而上学反思,既是一种对以往的批判,更是一种有力地超越。在传统哲学的叙述中,人的意义在逐渐地消亡,两位思想家都致力于
“境界”通常是指事物所达到的程度或表现的状况。在指称人的思想认识或道德修养时,则特指人在认识或修养过程中所达到的程度或表现的状况。文中所述境界不仅涉及人格美的标
化脓性眼内炎是眼球穿孔伤最严重的并发症 ,发病率约为1 0 % 【1】由蜡样芽孢杆菌导致的眼内炎 ,临床较少见 ,现报道 1例如下。患者 ,男 ,5岁 ,因右眼被小刀扎伤视力障碍 2小