论文部分内容阅读
迄今为止,维吾尔语信息处理仍然停留在单词处理、文字识别和语言资源建设(语料库建设)阶段,还没有涉及到维吾尔语短语以及句子的处理。这是因为维吾尔语是有形态的语言,短语的形成依赖于附加成分的作用而实现。而根据语音和谐律的要求,这些附加成分大多数有两个或更多的变体。因此在未解决附加成分的处理之前,要实现短语的处理是不大可能的。所以,目前根据维吾尔语语音和谐规律来处理维吾尔语词干与附加成分的结合是非常关键的。维吾尔语属黏着型语言,有大量的构词和构形附加成分。其中除了少数几个附加成分只有一种形式(如动词第三人称命令式附加成分-sun)外,绝大多数附加成分因元音和辅音和谐律的要求已形成多个变体。有的有两个变体(可称为双变体附加成分),如名词复数附加成分-lar~-l(?)r或名词从格附加成分-din~-tin;有的有四个变体(可称为四变体附加成分),如名词方向格附加成分-γa~-qa~-g(?)~-k(?);有的有多达八个变体(可称为八变体附加成分),如从动词构成名词的附加成分-q~-k~-(?)q~-ik~-aq~-(?)k~-uq~-ük。在双变体附加成分的形成过程中,起决定性作用的可能是元音,如复数附加成分-lar~-l(?)r是因需要与词干元音在发音部位的前后特征相和谐而形成的。但有的双变体附加成分中,起决定性作用的可能是辅音,而不是元音,如地点标志格附加成分-diki~-tiki是因需要与词干末尾音的清浊特征相和谐而形成的。在四变体或八变体附加成分的形成中,元音和辅音的和谐同时起了决定性作用。如方向格附加成分-γa~-qa~-g(?)~-k(?)不但体现了元音前后和谐的特征,而且也体现了辅音前后和清浊同时和谐的特征。一般来说,词干或词根与附加成分相结合时元音在发音部位上或发音方法上或者辅音在清浊方面相互一致。这种现象叫做语音和谐。维吾尔语语音和谐有两种,即辅音之间的和谐,也叫做辅音和谐。另一种是元音之间的和谐,叫做元音和谐。这些和谐都是非常有规律的,因此,完全可以用电脑处理。研究开发维吾尔语语音和谐处理软件对维吾尔语语料库建设有辅助作用。同时,对开发多种语言相互翻译软件也必不可少。本文论述了维吾尔语语音和谐规律以及语音和谐例外及其原因。与此同时,探讨了研制开发维吾尔语语音和谐处理软件的过程、软件总体设想、代码解析等。最后指出了此软件存在的不足并提出了改进方案。