基于格语法的藏语短句句法分析研究

来源 :西藏大学 | 被引量 : 0次 | 上传用户:info1
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着社会的发展与不断进步,信息技术在人类生活中扮演着越来越重要的角色。藏文信息处理技术从开始到现在不断地研究与进步,从最基本的字处理到应用阶段的机器翻译等研究一直在不断向前推进,现阶段也有很多成果已达到应用要求,惠及群众的日常生活。随着时代的进步,越来越多的功能性应用被人们青睐和使用,市场对藏文信息处理技术的需求越来越大,要求也越来越严格。由于藏语信息处理技术的起步相对较晚,研究人员比起英语和汉语等较少等的原因,比起英语和汉语自然语言处理,藏语自然语言处理远远落后。同样存在资源不共享等因素,造成很多研究成果只局限于封闭语料上的测试,无法得到公开的认可,这也阻碍了藏文信息处理的发展与进步。
  句法分析是自然语言处理中的关键任务之一,是机器翻译、语义理解等自然语言处理任务的基础。它研究句子中各个成分之间的约束关系和被约束关系,其最终结果是以树形图来表示成分之间的关系,句法分析依赖于句子的分词和词性标注的结果,而句法分析出来的结果往往影响其后各个自然语言处理任务的效果。
  现阶段藏语句法分析的研究一直是借鉴英语和汉语的技术,还没有形成一个公开认可、开放的句法分析器供大家使用。由于不同语言之间的差异,适合某一类自然语言的处理方法不一定适合另一类语言。不同于英文和汉文,藏文中有丰富的虚词连接各个实词来表达句意。汉语是按照词序来表达句意,而藏语是虚词来表达词语之间的关系来表达句意。以往藏文句法分析大都是建立在标准语法的基础上,缺乏藏文本身的语法特点。才华在基于格语法的藏语句法语义一体化研究中,通过藏语中的的格语法对藏文的句法和语义研究进行了分析研究。本文充分利用藏文语法本身的特点,按照藏文句子中格助词的作用和功能,借鉴Fillmore格语法和藏语格解构体的概念进行了藏文短句句法分析研究。其特点是在充分表现藏文本身的语法规则的基础上结合上下文无关文法进行研究,有利于提高藏语句法分析的效果。
  论文从藏语分词、词性标注、短语识别到最后的句法分析,实现了一体化的研究,分5个章节进行论述。第一章绪论,介绍了论文的研究背景、目的和意义等。第二章对藏语格语法与Fillmore格语法进行了简单的介绍.第三章研究藏文分词、词性标注。其中,分词作为最基础的任务,也是最重要的任务,先分别进行规则和统计的研究,比较分词效果,最后通过统计和规则相结合的方法进行了研究。词性标注部分用隐马尔可夫模型进行了研究。第四章对藏语名词短语和动词短语进行了研究,短语识别部分首先建立了规则库,然后通过规则匹配法进行了识别研究。第五章用格语法通过CFG对藏语短句进行了句法分析研究。第六章进行了总结与展望。
  藏文信息处理已经有20多年的历史,回望过去,从最基础的编码到各种应用的不断进步,学者们刻苦艰辛,为藏文信息技术的发展做了很大的贡献。但是由于藏文语法本身的特点限制和各种资源的缺乏,前进步伐缓慢,还需要更多研究着的参与和努力。从分词到词性标注,已经有很多学者进行了研究,也得到了很多的效果。但是藏语句法分析才刚刚起步,需要尝试各种方法进行很多的研究。
其他文献
记忆是一个古老的话题,而在相当长时间里记忆研究的主阵地都是心理学,近几十年才获得了人文社科、社会理论与文化研究的青睐。文学与记忆的关系同样古老,在进入当代研究者视野之前,两者的联系便已经存在。当前文学与记忆的研究视野中创伤记忆、文化记忆、个体记忆、集体记忆、互文性等往往成为关键词。记忆的伦理,在相当长时间里在哲学及其分支伦理学、社会学、历史学的领域中讨论热烈,但直到近些年来,才获得文学研究者的重视
学位
《说文辨异》为清代学者翟云升所着,共有8卷,将《说文解字》的前十四卷重新分卷,卷一、卷二、卷三、卷四、卷五、卷八都是由《说文解字》中的两卷合为一卷,如《说文辨异》中的卷一对应《说文解字》的卷一、卷二。卷六、卷七则是对应《说文解字》的卷十一、卷十二。《说文辨异》各卷内部根据《说文解字》的部首顺序列字,但并未收录所有的部首和字,共收字头2888个,先列部首,後列所阐发之字。每条将《说文》本论文条举於前
学位
《广六书通》,清人程瀚辑录。该书是一部篆体古文的字书,主要辑录的材料有《汗简》、《摭古遗文》、《集篆古文韵海》、《六书精蕴》、《六书正譌》等近百种书籍。《广六书通》“以韵分字,而以隶领篆”,楷体字头下主要收篆体古文,兼收印文的各种变体,间或录有金文,所收各种古文形体一般注明出处,其数少者一二,多者数十个。这些古文与字头,除形体相符外,还包括大量的异体、通假、同义换用、讹误、正字和俗字等多种关系。本
在表示“將食物放在水中加熱食用”這一概念時,現代漢語普通話和方言中常用“煮”,部分方言中也使用“煠”。在漢語史上有“烹”“煮”“缹”“湘”“胹”“煎”“瀹”“燉”“熬”“煨”“焯”“腤”“(月正)”等不同表達,我們將這些詞統稱爲“煮”義動詞。  全文共分三個部分。  第一部分是緒論,主要介紹了本文的研究對象及研究意義,梳理了有關“煮”義動詞的研究現狀,對本文所使用的語料、研究方法進行說明。  第二
学位
胡利奥·科塔萨尔是拉美文学“爆炸”的四大主将之一。他的多篇小说都将日常生活剖开了一个裂缝,通过描写各类空间体验来质疑人们的“日常生活”,并对二十世纪以来现代社会所谓的“现实”进行进一步思考,试图在观察和想象的基础上去触摸现实背后的超越性存在,同时对自我与存在进行终极追问。科塔萨尔的小说兼具幻想魅力与现实反思,他热衷于在刻画幻想经验与异质意象的基础上进行现实主义书写并思考现实。以空间切入研究科塔萨尔
痛苦大师弗朗索瓦·莫里亚克对人性保持着高度的敏感,致力于通过描写一个个家庭悲剧来坦露处在精神荒漠之中的人物。他擅长通过大量有关目光的描写来隐晦地展现权力的暗流。本文主要以《给麻风病人的吻》、《爱的荒漠》、《苔蕾丝·德斯盖鲁》、《蛇结》四本经典小说为研究对象,旨在将莫里亚克的小说置于视觉文化场域之下,借助“凝视”理论与福柯的“权力”哲学作为理论依据,考察莫里亚克小说中凝视的空间、凝视的方式以及凝视的
在玛格丽特·尤瑟纳尔的每部作品中,都不乏对人物欲望的关注、书写和表现,这与作家本人对欲望自成一体的理解、对欲望肯定的态度有关,也与她一生中的经历有关。在这些复杂多变的作品中,不同身份、性别和性格的人物身上潜藏着共同的欲望内在逻辑和展现方式,表现出相似的欲望过程和欲望叙事。以“世界迷宫”三部曲以及一些传记为参照,对其小说中的欲望书写进行考察,将发见尤瑟纳尔在小说人物塑造和叙事中蕴藏的现代性思想,无论
本文以陈河的华商小说为主要研究对象,以西美尔的陌生人理论为主要研究方法,讨论他作品中的离开祖国流浪异国的“陌生人”出走的动力机制、成为陌生人后所遭遇的多重困境和发挥自身能力进行反陌生化的资本积累。  绪论部分主要包括三个方面的内容:一是对研究对象、研究现状的介绍与说明,主要对陈河本人的经历、创作历程和本文主要研究的作品类型、当前学界的相关研究成果、当前研究的不足之处等进行了说明和阐释;二是对研究方
学位