【摘 要】
:
乌孜别克语名词词干识别是自然语言处理领域的基础研究,主要方法是从句子中提取名词词干,提高名词标注效率和准确性.该文首先陈述形态分析、形态特征对识别其词性的作用,然后
【机 构】
:
新疆师范大学计算机科学技术学院 ,新疆乌鲁木齐830054新疆师范大学文学院 ,新疆乌鲁木齐830054;新疆师范大学计算机科学技术学院 ,新疆乌鲁木齐,830054;
论文部分内容阅读
乌孜别克语名词词干识别是自然语言处理领域的基础研究,主要方法是从句子中提取名词词干,提高名词标注效率和准确性.该文首先陈述形态分析、形态特征对识别其词性的作用,然后讨论乌孜别克语的词类划分标准、名词的形态特征,乌孜别克语西尔里文转换拉丁文,乌孜别克语词汇翻译、标注技术,总结词缀歧义及消解规则.该文提出利用形态规则、词典、最大熵融合策略,设计现代乌孜别克语新词中名词词干识别算法,其中包括特征选择及参数估计、词内部特征、前后依存词特征等.最后以乌孜别克语网站文本作为验证对象,对名词词干进行统计与分析.
其他文献
随着生物数学理论的不断发展,中立型泛函微分方程已经被越来越广泛地用于描述生物种群模型的演化规律。中立型泛函微分方程一般被用来描绘当前时刻状态变化率依赖于历史时刻状
常微分算子理论是集常微分方程、泛函分析、空间理论及算子理论等理论、方法于一体的综合性,边缘性的数学.它还是量子力学、数学物理方程及其他技术领域的有力数学工具.常微分
在顶点(算子)代数理论中,我们可以通过仿射李代数构造一类顶点(算子)代数,而且此顶点代数的模范畴与仿射李代数的限制模范畴有一一对应关系。对于仿射Nappi-Witten代数()4,我们
科学与工程实践中的许多优化问题都可归结为多目标优化问题,这些目标通常相互竞争或相互冲突且无法直接比较优劣。而目前已有的多目标优化算法存在局部收敛、种群多样性差、时
本文主要分为两个部分.第一部分:在以往模糊测度和集值测度的背景下,首先,在正欧氏空间的子集类上通过引入集合的范数定义,给出了一种描述集合的新序,进而讨论了此序意义下集
Marcinkiewicz积分交换子是调和分析中重要的分析工具,本文借助于原子Hardy空间理论,利用Marcinkiewicz积分交换子的加权Lp有界性,证明了某种关于核的对数型Lipschitz条件下,带零
“师生合作教学模式”是一种建立在师生相互尊重、相互信任、互帮互学、情思共融之上的全方位的、立体的双向互动的教学新模式.它的核心是充分体现社会主义人文精神,特别强调
风险理论是当前保险学、精算学研究的重要课题,也是数学学科的一个重要分支.近十年来,风险理论的发展十分迅猛.风险模型中的破产理论是风险理论研究的焦点.本文研究的基本模型是经典的Cramer-Lundberg风险模型(?)(?)Erlang(2)更新风险模型,基于这两种基本模型,考虑了边界策略,我们研究的最新颖的边界策略模型是带税收策略的风险模型.本文首先介绍了经典的Cramer-Lundberg风险