现代维吾尔语常用词统计关键技术研究

来源 :中文信息学报 | 被引量 : 0次 | 上传用户：benxiaohai10000

【摘要】

：

本文研究了构建现代维吾尔语语料库的关键技术与方法,特别是现代维吾尔语语料库的构建,并对现代维吾尔语语料预处理技术,现代维吾尔语语料统计技术,现代维吾尔语词干提取技术

【作者】

：

艾孜尔古丽努尔艾合买提玉素甫·艾白都拉

【机构】

：

新疆师范大学计算机科学与技术学院,

【出处】

：

中文信息学报

【发表日期】

：

2014年05期

【关键词】

：

现代维吾尔语语料库常用词候选表计量分析

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

本文研究了构建现代维吾尔语语料库的关键技术与方法,特别是现代维吾尔语语料库的构建,并对现代维吾尔语语料预处理技术,现代维吾尔语语料统计技术,现代维吾尔语词干提取技术,现代维吾尔语数据分析技术进行了研究;研制了现代维吾尔语常用词候选表,从词语的使用频度和词语的分布两方面对词语进行了基本考察,将维吾尔语词语的“词种数、频次、频率、文本数、词长”作为常用词候选表的依据。 This paper studies the key technologies and methods of constructing modern Uyghur corpus, especially the construction of modern Uyghur corpus, and analyzes the modern Uyghur language corpus preprocessing technology, the modern Uyghur language corpus statistics technology, the modern Uyghur stem word extraction technology, the modern Uighur language Data analysis techniques were researched. The modern Uyghur language common words candidate list was developed and the words were investigated from the frequency of use of words and the distribution of words. The word number, frequency, frequency of Uyghur words , Text number, word length "as the basis for the common word candidate list.

其他文献

北京地区猫和豚鼠中弓形虫的分离

<正> 1981年至1982年期间,在过去工作基础上,我们继续对北京地区家畜动物进行弓形虫的检查,分别由当地猫和豚鼠分离到弓形虫三株。现将初步结果报告如下:供分离的动物为猫、

期刊

弓形虫

酿造酵母发酵松三糖的性能

<正>过去对酵母进行分类时,作为重要的生理指标是看其对糖类的发酵性,但到现在一般都以DNA为对象进行分类了。目前有重化学分类法而轻生理分类法的倾向,为此而进行酵母生理和

期刊

松三糖酵母发酵发酵能力

脱臭馏出物的三品联产开发

脱臭馏出物可开发出维生素E、植物甾醇、脂肪酸甲酯三大系列产品,由此构成了产业链长、产品价值高、利润丰厚的三品联产。文章阐述了三品联产开发的基本工艺路线,并分析了三

期刊

脱臭馏出物三品联产开发

苯乙烯装置蒸汽过热炉节能技术改进

蒸汽过热炉是苯乙烯装置中的关键设备，同时也是苯乙烯装置的主要耗能部位，在对装置进行能耗原因分析的基础上，通过在蒸汽过热炉炉底燃烧器入口处增加空气预热器、采用装置低温工

期刊

苯乙烯蒸汽过热炉节能降耗

武汉市房地产价格影响因素

本文基于分析历年房价影响因素变化,例如:建设成本、区位地价、人口、市场容量等,从供给与需求端对比找出对房价影响的最关键因素。

期刊

房地产价格供给层面需求层面影响因素

美国医改面面观

编者按：$$ 医药卫生体制不仅涉及亿万人民群众的切身生活，也为商业保险的发展提供了新的机遇和挑战。美国医改的诸多措施值得中国借鉴，本次专题主要介绍美国的医改和美国的医疗

期刊

结合径向基函数和KPCA的食用油太赫兹光谱特征提取方法

针对太赫兹光谱线性不可分的情况,提出结合径向基函数和核主成分分析(KPCA)的方法进行食用油太赫兹光谱特征提取。该方法所提取到的特征类内距离小,类间距离大,在大多数支持

期刊

太赫兹光谱径向基函数核主成分分析支持向量机

风愆消长关涉王朝兴衰

风，《毛诗大序》言：“风也，教也。风以动之，教以化之。”愆，则指罪过、过失。风愆，就是人们在日常生活中的不良风气或小的罪过。对于普通人而言，沾染不良的风气，或犯下了小的过失，恐怕

报纸

田径规则演变之研究

该文运用文献资料法、逻辑分析法、专家访谈法，对近二十年不同版本的田径规则进行对比分析，找出近二十年田径规则的演变趋势及不断演变的规则对教练员、裁判员、运动员提出的新

期刊

田径规则演变发展趋势

论我国刑法对未成年人权利保护的完善——以侮辱罪为例的分析

当前在我国各地出现了诸多未成年人侵犯未成年人身体健康、人格、名誉等人身权利的恶性案件,身体伤害又未达到轻伤标准,刑法对其的规制只有侮辱罪。通过对我国刑法第246条规

期刊

未成年人侮辱罪刑法保护

现代维吾尔语常用词统计关键技术研究

与本文相关的学术论文