维吾尔语的N-gram语言模型研究

来源 :电脑知识与技术 | 被引量 : 0次 | 上传用户：kaonub

【摘要】

：

针对基于维吾尔语的N-gram模型统计数据稀疏问题造成统计模型识别性能降低,研究针对政府文献和报告领域的语料进行了1到3元文法统计,采用加法、线性插值、Witten-Bell和Knese

【作者】

：

张亚军

【机构】

：

昌吉学院

【出处】

：

电脑知识与技术

【发表日期】

：

2011年6X期

【关键词】

：

语言模型平滑算法困惑度维吾尔语-汉语双语语料 language model smoothing algorithm perplexity Uyghur l

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

针对基于维吾尔语的N-gram模型统计数据稀疏问题造成统计模型识别性能降低,研究针对政府文献和报告领域的语料进行了1到3元文法统计,采用加法、线性插值、Witten-Bell和Kneser-Ney平滑算法进行了约束。结果表明,本实验中Kneser-Ney平滑技术可以大大降低统计维吾尔语的N-gram模型的困惑度。

其他文献

浅谈柱帽式无梁楼板柱帽模板支设方法

随着国内经济的快速发展,人们对空间利用率要求越来越高。柱帽式无梁楼盖能够降低楼层高度、提高净空利用率,同时具有结构简单、传力路径简捷等优点满足了这一点,但其支设方

期刊

柱帽无梁楼盖支设column capbeamless floorsupport

IEEE1394互连与其他双机互连方式的比较

该文介绍了IEEE1394发展的一般情况,介绍了一般利用IEEE1394接口技术互连两台计算机的基本方法,同时给出了普通网卡、USB联机线条件下双机互连的性能和特点比较。对双机互连

期刊

IEEE1394双机互连对比测试IEEE1394 networking two computers comparison test

维吾尔语的N-gram语言模型研究

其他学术论文