基于规则的藏语句法分析研究

被引量 : 10次 | 上传用户:ineedtoxiazai
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
句法分析是自然语言处理过程中一项基础性的工作,从二十世纪四十年代末到现在,国内外学者们设计了很多自然语言处理的形式模型,这些模型有基于短语结构语法的形式模型、基于合一运算的形式模型、基于依存和配价的形式模型、基于词汇主义的形式模型、N元语法、数据平滑和隐马尔可夫模型等,它们都对自然语言处理中的句法分析研究做出了积极的贡献。文中所提基于规则的句法分析方法主要是指chomsky的上下文无关文法,也是基于短语结构的语法。分词、词性标注以及句法结构的树形图表示,都属于句法分析的研究范畴。在描述分词部分时,对分词歧义类型及消歧方法做了详细的分析。除了利用传统的最大概率匹配法分词外,还提出了一种利用转移概率消解分词歧义的方法,文中称这种方法为词性转移概率消歧法,它在消解分词歧义上比最大概率匹配法更优越。自动词性标注是在藏语HMM模型基础上,用Viterbi算法进行的,还对藏语中的典型词性歧义及其消解方法做了分析。在句法结构的自动表示上,首先把藏语句型分成六个大类,并以此为依据,构建了一个规模为480余个句法树的树库,然后利用词性串匹配法,以树形图表示出藏语句子的句法结构。考虑到文中所用句法分析方法不能像线图算法、LR算法和Earley算法那样表示歧义句的句法结构。因此,对藏语中的常见歧义句做了分类,归纳出歧义句中存在的一些规律,利用概率上下文无关语法对句子歧义做了处理,使本文的句法分析系统具备解决简单歧义问题的能力。文中设计的句法分析器,能按照词性串匹配算法把树库中的所有句型对应的句法结构以树形图的形式直观地表达出来,但因为只有词性串匹配成功才能提取对应的用广义表表示的句法树,所以句法分析器的性能与词性串匹配算法没有太大的关系,而更多地依赖于足够高准确率的词性标注系统,因此,自动词性标注模块设计的好坏,会直接影响整个句法分析器的效果。
其他文献
目的:研究玉米芯多糖及其硫酸酯抗凝血活性的作用,探讨玉米芯多糖及其硫酸酯抗凝血机制,为玉米芯抗凝的临床应用奠定基础。方法:采用酸提法提取玉米芯粗多糖(ACC),并对其分级
村民制度化政治参与在一定程度上有利于实现真正意义的村民自治,有助于我国新农村的建设。以昭通市良姜村为例,通过实地研究,采用问卷调查法和访谈法,分析良姜村村民制度化政
<正>一、课题研究的背景(一)小学语文课程标准对识字教学的要求义务教育阶段《语文课程标准》总目标中提到"认识中华文化的丰厚博大""培植热爱祖国语言文字的情感","喜欢学习
会议
以塑料链板注塑模冷却水道的水道中心距、水道中心至模壁距离及水道直径为实验因素,利用响应面法分别构建出3个实验因素与模壁温差、冷却时间之间的二阶响应面模型。运用Pare
目的分析2008—2012年上海市某社区道路交通伤害的流行特征,为社区制定预防和控制道路交通伤害的策略提供参考依据。方法从上海市某社区公安交警部门收集2008—2012年5年的道
研究了辐照强度对燕麦片基本营养成分的影响,并测定了辐照前后燕麦片的理化性质。研究结果表明,经过辐照剂量从0~9 k Gy的变化,在2 k Gy时燕麦中脂肪质量分数最低为7.7%,水分
针对2YBZ-226型水稻播种机存在的质量大和两个并列设置排种器间振动的相互影响及不便于调节等问题,通过对2YBZ-226型水稻播种机的改进设计,研制出新的2YBZ-26型水稻播种机,且
石墨烯作为一种具有高比表面积以及优异导电率的碳材料,被广泛的应用在超级电容器上。石墨烯超级电容器是基于双电层电容效应来工作的,具有良好的循环稳定性。还有一类超级电
<正> 80年代以来,世界各地的局部战争和地区冲突接连不断。迫击炮,尤其是51~60毫米的小口径迫击炮,由于体积小,重量轻,携带和使用十分方便,成了各国游击队、突击队、快速反应
随着我国社会经济的迅猛发展,环境污染和资源浪费等现象日益严重,给人们的生产和生活带来了巨大灾难。沙尘暴、雾霾等自然现象频发警示我们对环境破坏的严重程度,促使我国对