论文部分内容阅读
词汇语义网是以词义与语义关系为经纬建立的人类语言知识表达基本架构。本文在吸收和借鉴WordNet及中文词汇语义网研究的理论与方法的基础上,结合蒙古文信息处理的现状,并充分利用了其它相关的资源,研究和实现了蒙古语名词词汇语义网。其目的就是以自动转换与人工干预相结合的方法构造蒙古语名词词汇语义网,能够应用于蒙古语词汇语义查询及机器翻译等应用系统。蒙古语名词词汇语义网主要是参照WordNet设计了蒙古语名词词汇概念及语义关系网络的框架,建立了蒙古语词汇语义数据库。语义关系的建立主要依据传统语义学的成果,包括现有各种词典和相关著作。本文为了兼顾WordNet框架的合理性和蒙古语词汇语义系统的独特性,从以下几个方面进行了研究和实验:(1)以《蒙古语语义信息词典》的名词分库、《蒙古语近义词小词典》中的名词部分及《类语辞典》中的名词部分为主要研究对象,建立了与WordNet词汇概念兼容的蒙古语名词同义词集合。(2)以蒙古语名词同义词集为组织单位,首先从WordNet移植语义关系,再利用《蒙古语近义词小词典》、《蒙古语辞典》等蒙古语各类语义知识库进行适当“修剪”后逐步生成符合蒙古语自身特点的词汇语义网。(3)结合计算机数据库技术和Web程序开发技术研究开发了蒙古语名词词汇语义网的查询维护程序。通过该程序系统向各类用户提供了一个方便快捷的蒙古语词汇语义信息查询应用功能,设计实现了数据库维护功能,解决了蒙古语名词词汇语义网的动态更新问题。(4)研究设计了基于蒙古语名词词汇语义网的歧义消除算法,给出了基于语料库的多义词和同形词歧义消除实验设计步骤及结果分析。