基于领域词典的汉语语块分析的研究

来源 :南京邮电大学 | 被引量 : 0次 | 上传用户:ccj66417
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
句法分析技术已经成为当前自然语言处理的一个瓶颈。但由于自然语言存在大量的复杂的结构歧义,使得句法分析举步维艰。可以采用分治的思想降低句法分析的难度,这就是近年来自然语言处理领域出现的一个新的语言处理策略——浅层句法分析(shallow parsing)。基于分治法的思想,可以将句法分析分解为三个子任务:1)语块识别,2)语块内部结构分析,3)语块间关系分析。浅层句法分析的主要任务是语块识别和语块内部结构分析。本文的目的是进行语块内部结构分析。语块的结构比较简单,大多是以简单短语的形式存在,可以转化为词语与词语之间的关系来进行分析。本文的主要工作概括如下:1)分析词语间的相互关系。本文总结词语间的关系主要为:上下位关系、整体部分关系、同义反义关系、蕴含关系、致使关系等。2)利用词语间的关系构建领域词典。为了分析语块内部结构,本文构建了一个领域词典,该领域词典是在词语与词语间的关系基础上建立的,以词语间的上下位关系为主要关系,把词典构建为一个树形的拓扑结构,并对单一词性的词语和兼类词分别构建词语关系树。领域词典中的每个词语都对应于该树形结构中的某个节点,每个节点都表示一个词语,每个词语都包含编码、词性等属性,其中词性蕴含在编码中,这些属性值用XML来存储。3)利用领域词典对语块内部的语法关系进行分析。构建领域词典的目的是为了进行语块内部结构分析。为了达到这个目的,本文认真研究了语块的内部结构,并找出了语块内部结构与词性的关系,这样就形成了语块类型判断策略。以领域词典为基础,运用语块类型判断策略,可以比较迅速的判断语块的结构。在文章最后阶段,通过程序的运行,验证了本文上述语块判断策略的可行性。
其他文献
目的:研究大黄对内毒素性休克大鼠炎性介质作用的机制。方法:选用大鼠内毒素性休克模型。随机分为6组:单纯手术组、内毒素组、大黄预防用药组(150mg/kg组和750mg/kg组)和大黄治疗组(150mg/kg组和750mg/kg组)。检测磷脂
利用太湖全湖64个采样点的数据,分析了各水色因子及真光层深度的空间分布和变化特征,并探讨了其对水生植物光合作用的影响.结果表明:叶绿素a浓度在全湖间的差异最大,其变化范
目的探讨穴位按摩对直肠癌结肠造口患者负性情绪及生活质量的影响。方法选取2016年6月—2017年6月收治的直肠癌结肠造口患者90例,随机分为对照组和观察组,各45例。对照组行直
引言无穷级数的基本问题之一是其收敛性的判别问题。该问题反映了无限过程中有限与无限的矛盾,这一矛盾的解决是成功运用极限理论的一个典范。本文拟从理论和应用两个层面对此
员工是酒店最宝贵的财富。酒店管理,以人为本,留住人才,发挥员工的主观能动性,并为其进行职业生涯规划,对中小酒店取得良好的经济效益和社会效益有着至关重要的作用。
利用失血性休克和内毒素对肠粘膜屏障的致伤模型,对大黄的肠粘膜屏障保护作用机制进行了部分研究。失血性休克模型的肠粘膜病理检查显示:大黄能促进肠粘膜内杯状细胞大量增生,增
分析煤矿瓦斯治理的现状和意义,探讨煤矿瓦斯治理和防治策略中存在的问题,并依此提出煤矿瓦斯治理的策略和措施。
本文主要介绍了尖山水库除险加固项目勘测设计测绘任务实施情况及测绘成果资料技术总结,对已有成果资料利用、施测依据、E级GPS控制测量、四等水准测量、地形图测绘及断面图测绘进行技术说明,满足测量规范及项目设计书要求。尖山水库通过此次测绘和除险加固,为水库的工程建设和安全运营生产以及长远发展奠定了良好的基础。
在借鉴可持续发展和宜居城市等评价方法的基础上,建立了一套社会-经济-自然复合生态系统生态位评价的指标体系.复合生态系统综合生态位包括资源、环境、经济和社会4个子系统