藏语自动分词中的几个关键问题的研究

来源 :中文信息学报 | 被引量 : 0次 | 上传用户:qinqincy
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在分析现有的藏语自动分词方法基础上,该文通过分析藏文构词规则、句法结构、词的前后词性关系、后加字(R)的添接法和格助词的用法等来重点研究了未登录词、紧缩词和交集型歧义的识别及处理方法,并提出了“重组法”,“排除—还原法”和“词性规则法”三种方法.经测试,在文学类、诗歌类、医学类和新闻类等大小为1M的藏语语料中未登录词、紧缩词和交集型歧义的识别准确率分别达到99.84%、99.95%和92.02%.
其他文献
隨着我国教学事业改革進程的不断加剧,素质教育理念也逐渐深入人心,并且也对我国高中物理教学活动的开展造成了重要影响。在这一新形势背景下,相应的也对高中物理教师教学水平提出了更多的要求,因为只有这样才能确保高中物理教学活动实现更加有效的开展,进而也更有助于推动我国教学事业的有效改革,而本文也将对这一主题展开试论。  1新形式下的高中物理教学活动有效开展的意义  1.1更加符合素质教育理念相关要求  素
主题抽取是意见挖掘的核心任务之一。该文面向维吾尔语评论文本,针对显式主题和隐式主题,提出了一种陈述级的主题抽取方法。该方法采用GLR-Cascaded LDA模型抽取段落级的局部
【摘要】:随着我国教育事业的发展,初中体育在教学中的地位不断上升。对体育游戏在初中体育教学中的作用进行研究,以体现其真正的教学意义和实践价值。  【关键词】:初中体育 体育游戏 应用在时代不断进步的背景下,为使我国初中体育教学综合发展取得较大的成就,需要教师与学生的共同努力。传统的教学方式和体育项目单一,且毫无乐趣可言,严重地影响教学质量和降低学生学习的积极性。自新课改实施以来,我国初中体育教学方
水族文字被称为水书。为了满足水书研究者和出版业界的需要,设计了水字字符集的Unicode编码,利用字体制作软件建立了水字TrueType字库。该文提出了一种基于笔形特征的编码方法,
情感分类旨在对文本所表达的情感色彩类别进行分类的任务。该文研究基于半监督学习的情感分类方法,即在很少规模的标注样本的基础上,借助非标注样本提高情感分类性能。为了提高
该文通过考察事件词在文本篇章结构中的分布方式,指出突发事件新闻报道文本中包含主线信息链和副线信息链。主线信息链中包含了文本的事件信息,是事件信息提取重点考虑的文本