【摘 要】
:
本文首先以收集整理录入的方法,以安多、康巴、卫藏三大方言藏语谚语及《格萨尔谚语》为基础,建立了藏语谚语语料库,并对语料进行自动分词和人工校对,确定谚语词汇切分原则,
论文部分内容阅读
本文首先以收集整理录入的方法,以安多、康巴、卫藏三大方言藏语谚语及《格萨尔谚语》为基础,建立了藏语谚语语料库,并对语料进行自动分词和人工校对,确定谚语词汇切分原则,从而构建了藏语谚语语料库及分词库。在内容上将藏族谚语按相关文献的基础上再细分为十二种类型。在搜集整理的过程中,谚语在形式的划分上新增加至三十二种。从谚语中词条数量分布、词汇的频度和频率三方面对《藏语谚语》进行了研究。最后根据藏族三大地区方言藏汉对照、按字母顺序排序和内容分类三种方法分别进行排序和检索。其作用主要应用于两个方面:一是作为计算机藏文信息处理系统的藏语谚语语料库构建,为藏文信息处理服务。二是作为藏语文学习的工具书及藏语谚语词语研究的基本资源,供藏语文学习者和研究者使用。本文的研究目的在为未来藏文信息处理领域中的句法分类标注、自动分词、句法研究、短语研究、机器翻译、搜索引擎、电子词典编纂等方面做基础工作;为今后藏族文学研究提供了一种新的研究方法和手段。其创新点在于:一是搜集整理了大量零散的藏语谚语,到目前为止是整理最多的;二是针对计算机信息处理进行了分类及标注;三是建立了藏语谚语双语对照语料库;四是对藏语谚语构建了检索程序,为今后学习、研究双语教学提供了便利条件。下一步的工作是把所搜集整理的藏语谚语词条进行翻译;在混合排序中,把内容、形式、段落和音节停顿的标注在点击相关词条时可同时在该词条中出现,是进一步学习和研究的任务。本文认为构建高质量的藏语谚语库不仅能够更好的掌握和利用藏语谚语这块瑰宝,为研究藏语言文学领域提供不可或缺的语言材料,从而也扩充藏语自然语言处理相关文本资料库。
其他文献
物联网的发展,使得M2M(Machine to Machine机器对机器)业务发展迅速,覆盖了交通、物流、公安、医疗等多个领域。M2M终端的数量也在不断增加,如何对数以亿计的M2M终端进行有效
对靶变量喷雾技术是智能植保的重要组成部分,满足了精确喷雾的要求,对发展适合我国国情的可持续农业具有重要的理论意义和实用价值。本文结合对靶喷雾和变量喷雾,设计了对靶
哈姆莱特形象以其矛盾复杂的内蕴为显著特征 ,主要表现为人文主义与非人文主义交织混杂的思想、善恶兼备的道德取向和矛盾偏执的性格 ,由此构成了哈姆莱特形象的多面性、丰富
在目前的对外汉语教学中,写作教学是其薄弱环节,因而在对外汉语教学研究中,对写作教学进行研究的成果相对较少,其中对书面表达中词语误用的研究更是少之又少。本论文以俄罗斯
采用原子转移自由基聚合法(ATRP)将二甲基丙烯酸甘油酯(GDMA)接枝到聚偏氟乙烯(PVDF)主链上合成两亲性共聚物改性剂PVDF-g-GDMA,采用非溶剂致相转化法(NIPS)将改性剂PVDF-g-G
社团发现技术旨在挖掘网络的社团组织结构。基于结构的社团发现方法忽略了社会网络中蕴含的话题。结合话题属性挖掘网络的社团结构对于分析社会网络的组织结构、更加高效地预
目的从思维方式上研究现代包装设计的创新。方法从时尚、文化、人性化这3个方面分析了现代包装设计的创新思维方式。结论现代包装设计必须充分考虑时代特点、文化内涵,理性地
语言的对比研究是一门新兴学科,近年来,越来越多的学者将对比的方法应用于语言研究中。汉语和英语作为使用人口最多、应用范围最广的两门语言,其对比研究自然是学者们关注的
《现代汉语词典》是目前公认的最具权威性的中型语文工具书,四字是成语最基本的形式,四字成语是语文词典收录的重要对象之一。本文以《现代汉语词典》第6版和第5版中的四字成
《鲁豫有约》和《奥普拉脱口秀》分别是21世纪初中国和美国访谈节目中的杰出代表,因为两个节目有很多共同点,鲁豫也因此被称为"中国的奥普拉"。虽然这两个著名节目的相似点很