基于变音符号的离线阿拉伯文笔迹鉴别

被引量 : 0次 | 上传用户:kmask
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
离线文字笔迹鉴别技术是依据文字笔迹对书写人身份进行判别的一项技术,随着应用领域的不断扩展,离线文字笔迹鉴别技术已经成为计算机视觉和模式识别领域一个十分活跃的研究课题。它几乎包括了图像处理和模式识别领域中的所有典型问题,如图像预处理,特征提取和分类器设计等等。本文的主要目的是研究离线阿拉伯文笔迹鉴别。仅次于拉丁字母,阿拉伯字母是全世界第二大广泛使用的字母语言。除了阿拉伯语之外,它也用于许多其他语言,例如波斯语,乌尔都语,普什图语,维吾尔语(在中国),斯瓦希里语(东非)等。但这种广泛使用对解决阿拉伯文的手写识别和鉴别问题并没有任何好处,这是由于语言本身的自然复杂性,以及人们试图把一些在其他语言成功的方法直接应用到阿拉伯语去。在本文,为了处理阿拉伯文笔迹,我们走了一个完全新的方向,我们首先把输入笔迹图像分割成两部分,其中一个包含了所有字母,另一个包含了所有变音符号。这样做的目的是为了能够利用变音符号的简单性来进行鉴别,比如,跟字母比较,变音符号能够反映手写独特和风格,分割也是很容易的。使用IFN/ENIT阿拉伯语手写数据库,我们设计的系统是根据典型笔迹鉴别系统的体系结构而建立的,它包含以下部分:1.预处理:数据库中的图像已经去噪音和阈值了,因此,预处理的主要功能只是将变音符号从输入笔迹图像分割出来。2.特征提取:我们计算了每个变音符号的局部二进制模式(LBP)直方图。然后把由同一个书写人的变音符号的LBP直方图都串接起来构成特征向量。3.分类:我们采用两个嵌入的K-NN分类器,一个用于变音符号识别,另一个为书写人识别。我们使用X2函数作为距离函数。实验表明,我们的方法对阿拉伯文笔迹鉴别是有效的。它与其他方法相比,我们的方法更优势,例如,对输入样本数目要求不高。其次,我们的方法是一个阿拉伯文专用方法,这意味着,与其他语言在同一张输入笔迹图像共同存在的条件下将不影响鉴别结果。
其他文献
扇贝营养丰富,口味鲜美,备受人们青睐,现已经成为我国沿海水产养殖的主要品种之一。扇贝裙边,约占活体9%,常常作为扇贝加工副产物被当做废弃物丢弃,造成了资源浪费。然而扇贝
目的观察鼻渊软胶囊联合桉柠蒎肠溶软胶囊对慢性鼻窦炎患者临床症状、鼻黏液纤毛传输速度和炎症因子的影响。方法将104例慢性鼻窦炎患者随机分为2组,对照组52例应用桉柠蒎肠
飞机在起飞和着陆过程中以及在低空、高速飞机过程中,都可能和飞鸟发生碰撞,鸟撞问题日益成为危及飞行安全的隐患,飞行器结构鸟撞问题越来越引起人们的注意。飞机典型结构(如
目前,燃气轮机在航空、航海、发电等领域有着广泛的应用。针对不同应用场合的燃气轮机,需要开发出相应的控制器以满足其控制需求。分布式控制系统是燃气轮机控制系统的发展趋
我国森林资源总量不足,分布不均,而且由于天然林保护工程的实施,使得木材资源短缺的问题日益严峻,国内的需求量却与日俱增,供求矛盾日益显现,加上我国对于木材的综合利用率较
对大庆龙凤湿地土壤Cu,Cr,Cd,Zn,Pb和As六种重金属元素的空间分布特征进行了研究。结果表明:湿地土壤表土层(0—10cm)Cu,Cr,Cd,Zn,Pb和As在水平分布上的变化较大,除Cr和Zn外,
<正>2010年,互联网金融概念首次在国内提出。随后,以第三方支付、网络信贷、众筹融资为代表的互联网金融模式以其便捷、低成本和强大的数据积累等优势得以迅猛发展。当前,商
建立了季铵盐的离子色谱分析方法。采用Dionex DX-500型离子色谱仪,C18柱,电导检测器,以30%乙腈和10mmol/L甲烷磺酸混合溶液为流动相,流量为1.00mL/min。四乙基溴化铵和四丁
随着我国工程建设领域市场化改革的进一步深入 ,加快工程造价管理体制改革 ,早日实现与国际惯例接轨变得必要而紧迫。本文通过对我国与发达国家工程造价管理模式的比较与分析
<正>"大数据时代"来临随着我们的生活进入信息时代,数据正在迅速膨胀并呈现出几何级数的增长,数据决定着银行的未来发展。虽然有些银行可能还没有意识到数据爆炸性增长带来的