【摘 要】
:
结合网络上流通的拉丁化维吾尔文字特征,以拉丁化维吾尔文单词作为研究单位,首先,通过大规模文本语料库建立了固定词库、词首字母序列库、词尾字母序列库以及特殊词库等正规
【机 构】
:
新疆大学政治与公共管理学院,新疆大学信息科学与工程学院,新疆大学软件学院
【基金项目】
:
国家社会科学基金(13BYY062), 国家自然科学基金(61163033), 新疆多语种信息技术重点实验室开放课题
论文部分内容阅读
结合网络上流通的拉丁化维吾尔文字特征,以拉丁化维吾尔文单词作为研究单位,首先,通过大规模文本语料库建立了固定词库、词首字母序列库、词尾字母序列库以及特殊词库等正规化规则库。然后,利用维吾尔单词中的字母序列结构特征和相邻字母上下文信息进行了拉丁化维吾尔文的正规化,同时引用最小编辑距离的方法进一步提高了正规化正确率,并用Visual C#编程工具实现了基于规则的拉丁化维吾尔文的正规化算法。最后,给出了实验结果,并分析了结果不佳的原因及相应的对策。
其他文献
在最近的年(2007 ~ 2011 ) 里,尽管在中国的狂犬病诉讼的全面数字减少了,有没有以前的狂犬病诉讼或与狂犬病的低发生,在区域出现或 re-emerging 诉讼的证据。调查在中国影响狂犬
人的免疫不全病毒类型(HIV-1 ) 1 能交往与并且利用主人复制并且宣传自己的细胞的机械。众多的研究证明了激活 Mitogen 的蛋白质 kinase (MAPK ) 信号小径罐头断然调整 HIV-1
当地时间11月18日上午7时,在“拖堂”13个小时之后,《联合国气候变化框架公约》第23次缔约方大会(亦称“波恩气候大会”)在德国波恩落下帷幕。大会通过了名为“斐济实施动力”的
党的十八大以来这五年,是全面深化改革取得重大突破的五年。作为“四个全面”战略布局中具有突破性和先导性的关键环节,全面深化改革成为推进“四个全面”落实并发挥作用的强大
纺织品是中国重要的出口商品,1987年全国共出口纺织品80多亿美元,占中国出口总金额约320亿美元的28%左右。 根据当前国际纺织品市场需求和贸易的发展趋势,中国扩大纺织品出口
<正>今年的一号文件,先后6次提到品牌(培育国产优质品牌、推进区域农产品公用品牌建设、打造区域特色品牌、提升传统名优品牌、强化品牌保护、聚集品牌推广)。农产品品牌建设
本文根据1S09001、IS014001及OHSASl8001标准,为企业进行质量、环境及职业安全健康管理体系整合并实现一体化管理提出了实施模式。
<正>Dear Editor,In this study,we re-identified the hosts of cyanophage PP.Twenty-three candidate algal strains were tested,and the results indicated that seven