基于最小编辑距离的维语词语检错与纠错研究

来源 :中文信息学报 | 被引量 : 0次 | 上传用户:LittleMeteor
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
拼写错误的发现和候选词选取是文本分析中的一个重要的技术问题。本文结合维吾尔语的语音和词语结构特点,列出了文本中常见的拼写错误类型,详细分析了解决方法,利用最小编辑距离(minimum edit distance)算法实现了维吾尔语文本拼写错误分析中的查错和纠错功能,并以此为基础,结合维吾尔语构词规则,进一步提高了建议候选词的准确率和速度。该算法已被成功地应用到了维吾尔语文字自动校对和多文种文本检索等领域中。在以新疆高校学报为语料的测试中,词语查纠率达到85%以上。
其他文献
一、观念创新观念是行为的先导,没有观念上的创新,就谈不上有经营和管理上的创新行为。不能否认,由于受计划经济长期的影响和观念作为人们思想意识形态的本身特性的影响,在当
近年来儿童学习乐器热不断升温。随着乐器考级活动的广泛开展,让孩子有了一个展示自己的机会,不少家长纷纷把自己的孩子送去学琴。但是,在这广泛的学琴热潮中,渗透出一种让人
我们知道音乐教学有三个突出的难点:一是理解音乐的困难性;二是技能训练的精密性;三是听觉训练的灵敏性。音乐是以有节奏的声音,以乐音的运动形式来表达人们思想情感的一门艺
“二零零一年度叱咤乐坛流行榜颁奖典礼”记者会上,香港一班年青歌手,有谢霆锋、陈奕迅、容祖儿、许志安、陈慧琳、何韵诗、车婉婉、陈小春、李彩桦、方力申、周永恒、陈司翰
阅读理解问答系统指的是能够自动分析一个自然语言文章,并且根据文中的信息为每个问题生成一个答案的系统,具有很高的研究价值。然而,缺乏中文阅读理解语料库已经成为制约汉
随着“港台”“第二十四届十大中文金曲颁奖礼”落下帷幕,港台地区的四个颁奖礼终于完结。计算“新城”、“商台”“无线”和“港台”四个传媒奖项总数,结果分别获得十五个奖
团队,是代表一批员工的组合,是一个有机的整体组织。团队精神从广义上讲就是一种团结协作、敬业奉献、拼搏进取、共创辉煌的集体主义精神。在形势严峻,面临困难和挑战的关键
<正>~~
本文提出了一个基于现代汉语述语形容词机器词典以及平衡语料库的形容词多信息聚类算法。聚类的过程根据形容词的语料提取了三重信息(所修饰的名词,同义近义词以及反义词),从而
对项目教学法在中职数学教学中的应用进行研究,阐述项目教学法的概念;探讨项目教学法的实施原则及实施过程;介绍在中职数学教学中应用项目教学法取得的成效.