联机手写藏文识别特征提取方法的研究

来源 :西北民族大学 | 被引量 : 0次 | 上传用户:donglu1116
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本论文和相关研究得到国家自然基金(基金号:60273090)的支持。特征提取是联机手写藏文识别进行中的关键问题。围绕这一难题,本文依据统计和结构两种方法的优点,提出了统计与结构方法相结合的特征提取方法。该方法是从藏文字丁的特点出发,对联机手写藏文识别的三个主要方面:预处理、笔段提取、笔划类型统计,进行了深入的研究,使抽取的特征相对稳定,藏文字丁的基本笔划类型更具科学性,这些都是同类联机手写识别系统中所未见的功能,同时联机手写藏文识别特征提取的研究为分类器的输入奠定了良好的基础,对提高整个系统的效率和实用性有很重要的意义。 所谓统计与结构相结合的特征提取的方法就是在藏文字丁的笔段抽取中采用结构的方法,即在对输入字的点阵图像进行字形纠正以抑制手写变形和噪声的基础上采用非线性规范化的方法和消除噪声的方法使得藏文字丁的特征稳定,进而由长短臂长动态结合的方法得到字丁的笔段;在藏文基本笔划类型的获取中采用统计的方法,分析各种笔划类型,提出笔划分类算法(如近邻法,树型分类法,基于最大最小距离试探的聚类搜索算法),对大量的样本进行笔划统计,得到16种笔划类型19种笔划的藏文基本笔划表。 将统计与结构相结合的特征提取模块和所得到的基本笔划加入识别测试系统,首位识别率最高为72.43%,前10位的识别率最高92.98%,平均首位识别率为67.34%,前10位的识别率为90.57%,比以前的识别系统的识别率平均首位识别率提高了7.63%,前10位的识别率提高了2.16%。
其他文献
多传感器数据融合是信息的综合与处理过程,即为了完成所需的决策和估计任务,对在不同的时间序列上获得的各种传感器信息按一定的准则加以综合分析。它包括对各种传感器给出的有
精炼炉是炼钢生产中非常重要的炼钢设备。它不仅能够协调生产节奏,而且还负责调整钢水成分和控制钢水温度等重要任务。本文以我国广西柳州钢厂精炼炉为背景,在研究分析了精炼
计算机网络特别是Internet的快速发展为社会带来了无限价值,它几乎已经覆盖了各个领域。但作为互联网络的主要协议IPv4(Internet Protocal Version 4)由于自身的限制,已经逐渐
本文主要阐述了基于目前成熟的VRS网络设计分米级差分GPS接收机。该系统设计过程主要从以下几个方面阐述:首先从实际出发,讨论本课题研究的意义和国内外的研究现状,简单的介绍了
随着网络技术和软件技术的飞速发展,特别是Internet/Intranet的发展,大多数信息资源已不光只是结构性资料,而是出现了很多丰富多样的非结构化形式提供给使用者。各种信息资源迅速
现在人们对软件功能的要求越来越高,软件的编写越来越复杂,软件的规模越来越大,动辄数百万行乃至数千万行代码,用简单的文本编辑器编写代码,效率低下,不容易维护及调试,已经不能满足
众所周知,能力成熟度模型CMM的过程改进对于提高软件开发的质量和生产效率是极其有效的手段,为软件产业的发展和壮大做出了巨大的贡献。从CMM发展到能力成熟度模型集成CMMI的
随着Internet技术的飞速发展,远程教学作为一种新型的教育模式已经成为近年来各国教育界的重要研究课题。其中实验教学的实现成为了研究的重点和难点,而虚拟实验是解决这一问
随着网络技术的不断发展,尤其是多媒体应用需求的增加,出现了一对多、多对多的组通信需求,针对互联网上的大规模一对多数据分发问题,有三种可选的通信模型,分别是纯单播,IP组播,应用
目前,随着全球经济的快速发展及金融系统的信息化,金融网络中洗钱犯罪已受到各个国家的广泛关注,因此,金融网络中发现洗钱社区结构的研究已经成为人们关注的热点。  本文通