论文部分内容阅读
摘要:本文主要是研究并设计了文字特征提取、文字特征识别以及基于数字图像预处理的文字识别方法。在研究文字的数字图像预处理时,提出了一种算法,叫做数字文字图像的信息增强算法,这可以精确定位数字文字图像;而且还实现了对数字文字图像架构信息的分析提取,以及在非完整文字获取情况下的算法修正。并且,通过对文字笔画、位置等的分析,设计了特别的提取算法,以及特征识别器,实现了数字文字的特征提取,以及后续的识别,并对测试样本进行了测试。
关键词:数字识别;数字图像处理;结构特征
一、图像处理技术
在当今世界,计算机的使用与普及已经远远超乎了人们的想象。所以,在文字图形处理方面,人们也开始想要运用计算机技术来简化工作,于是就出现了一种新的技术,叫做图像识别技术。
图像识别技术,也就是指运用计算机这种处理工具,将图像先变成数字信息保存,然后再处理或重现。我们所研究的文章方向的数字图像识别是指利用计算机的数字图像识别技术来整篇地识别出文字,而节省人力进行文字图像转文本的工序。
目前,利用这项技术的方面越来越多,可是日益增长的技术需求面对的却是技术不成熟的图像处理技术,在现今,计算机对外部信息的感知依然不能称之为智能感知,所以感知力仍然很薄弱,所以依然需要大量的人力物力来维持技术的实现,我们要所做的就是改变这种局面。
我们总说,图像信息,图像确实是一种信息,里面可以存储着许许多多的信息,所以处理方法也就复杂多样了。一些数字设备比如说计算机会把图像转化成数字信息存储,然后在通过一些手段进行重现、处理或者传输。从很早开始,数字图像识别技术就有了应用,比如航天科学、信息安全、工农业生产、物理学、医疗卫生、军事科学等。
数字图像识别的处理系统主要包括三个部分:数字化一仪器、计算机设备、显示设备。我们得到的物理图像被划分成不同的小格。每个小格我们称之为像素,在图像处理方面,主要是以像素为单位进行处理。我们在图像的色彩、亮度等方面通过对像素性质的改变来处理图像。每个像素的信息被量化,而得到图像所对应的矩阵,把矩阵信息以一定的形式存在电脑中,就实现字图像的存储。然后再经过一些技术上的处理,就可以进行后续的传输、重现等。
在以上的三个基本部件中,毋庸置疑,计算机是最重要的。可以这么说,对于图像进行的数字处理与识别工作的绝大部分都是靠计算机技术才能完成的,每一种处理图像的算法也都是有了计算机才能实现,因此,计算机技术的发展也影响着图像识别技术的发展。
我们本次研究主要以文章方向的数字图像识别技术为研究重点,选取了几种图像处理的常用技术作为研究对象,比如锐化、中值滤波等等。并由Visual C++来实现。现在,数字图像的识别技术正在不断地发展,应用也比较广泛。
二、数字图像处理的常用方法
所谓图像增强,就是为了改善画质,为了使人们更好地从图像中获取信息,当然,在本例中,应该是为了使计算机更好地识别图像中的信息,就是改善視觉上的效果。图像增强其实在很多方面都有应用,因为它方法简单却效果明显,在数字图像识别领域具有十分重要的地位。以下是三种常用的图像增强的方法:
1.灰度增强
灰度增强的意义是指在图像处理中按照一定变换关系逐点地改变原来图像中每一个像素的灰度值。图像会变得更加鲜明,这是灰度增强的好处。
2.锐化
由于客观因素,比如信道的通带过窄或者摄像系统的聚焦不好,就可能会造成图像中目标信息的轮廓模糊不清。而图像锐化技术就是一种可以加重图像的轮廓的技术。一般来说,经过锐化技术处理过的图像往往比精确再现的图像更加清晰。所以说,图像锐化的作用就是针对处于目标轮廓上的像素,使其灰度值比原来小的更小,比原来大的更大,而对轮廓以外的像素不起作用。
3.中值滤波
中值滤波是一种非线性处理技术,它的主要目的抑制图像的噪声。我们知道,在一维情况下,中值滤波器它是一个含有奇数个像素的窗口。中值滤波的处理原理是对于位于窗口正中像素的灰度值,就用窗口内个像素灰度值的中值代替。因为中值滤波不影响阶跃函数和斜坡函数,所以它对图像边界也是有保护作用的。
三、识别步骤
1.数据获取:数据获取的过程是指为使计算机能够对各种现象进行分类识别,用计算机可以运算的符号来表示所研究对象的二维图像。通过采样、测量和一些量化处理,然后用向量或矩阵表示成二维的数字图像。
2.预处理:获取的图像都需要经过预处理,预处理的目的是去除噪声,加强有用的信息,同时其它因素或对输入测量仪器所造成的图像的像素退化现象进行复原。
3.特征提取和选择:因为图像包含了很多信息,所以由图像所得到数字图像中含有的数据量非常大。为了有效地实现信息的分类识别,要对最原始的数据先进行一定的变换,然后得到的取最能反映信息分类本质的特征。
4.分类决策:是指在我们所说的特征空间中用统计学的科学方法把被某些识别对象归为某一类别。在复查时,分类决策方法可以在一定层面上减少信息采集时的错误概率。
结束语
在本文中,我们所说的文章方向的数字图像识别技术其实是一个范围很大的技术领域,作者在此只是有选择地进行了一些研究。其实,仅就文章方向的数字图像识别技术这一部分而言,就有很多需要继续完成的工作,可将这些问题与其它一些数字图像处理方法进一步同步实现,如图像的膨胀腐蚀、图像矩阵的变换、各种编码图像的读写与显示,以及图像的几何变换。这一部分可以做成一个专用的文字图像处理平台。在一定意义上,本次研究基本明白了文字的数字图像处理与识别的常用技术,而还有很多具体的数字图像识别处理方法可以继续学习并实现,研究中的识别方法还可以进一步研究和更新。(作者单位:沈阳师范大学学院科信软件学院)
参考文献:
[1]郑建英.数字图像处理技术[J].内蒙古科技与经济,2002(5):58-59;
[2]章毓晋.中国图像工程及当前的几个研究热点[J].计算机辅助设计与图形学学报,2002,14(6):489-493;
[3]周杰,卢春雨,张长水等.人脸自动识别方法综述[J].电子学报,2000,28(4):102-106;
关键词:数字识别;数字图像处理;结构特征
一、图像处理技术
在当今世界,计算机的使用与普及已经远远超乎了人们的想象。所以,在文字图形处理方面,人们也开始想要运用计算机技术来简化工作,于是就出现了一种新的技术,叫做图像识别技术。
图像识别技术,也就是指运用计算机这种处理工具,将图像先变成数字信息保存,然后再处理或重现。我们所研究的文章方向的数字图像识别是指利用计算机的数字图像识别技术来整篇地识别出文字,而节省人力进行文字图像转文本的工序。
目前,利用这项技术的方面越来越多,可是日益增长的技术需求面对的却是技术不成熟的图像处理技术,在现今,计算机对外部信息的感知依然不能称之为智能感知,所以感知力仍然很薄弱,所以依然需要大量的人力物力来维持技术的实现,我们要所做的就是改变这种局面。
我们总说,图像信息,图像确实是一种信息,里面可以存储着许许多多的信息,所以处理方法也就复杂多样了。一些数字设备比如说计算机会把图像转化成数字信息存储,然后在通过一些手段进行重现、处理或者传输。从很早开始,数字图像识别技术就有了应用,比如航天科学、信息安全、工农业生产、物理学、医疗卫生、军事科学等。
数字图像识别的处理系统主要包括三个部分:数字化一仪器、计算机设备、显示设备。我们得到的物理图像被划分成不同的小格。每个小格我们称之为像素,在图像处理方面,主要是以像素为单位进行处理。我们在图像的色彩、亮度等方面通过对像素性质的改变来处理图像。每个像素的信息被量化,而得到图像所对应的矩阵,把矩阵信息以一定的形式存在电脑中,就实现字图像的存储。然后再经过一些技术上的处理,就可以进行后续的传输、重现等。
在以上的三个基本部件中,毋庸置疑,计算机是最重要的。可以这么说,对于图像进行的数字处理与识别工作的绝大部分都是靠计算机技术才能完成的,每一种处理图像的算法也都是有了计算机才能实现,因此,计算机技术的发展也影响着图像识别技术的发展。
我们本次研究主要以文章方向的数字图像识别技术为研究重点,选取了几种图像处理的常用技术作为研究对象,比如锐化、中值滤波等等。并由Visual C++来实现。现在,数字图像的识别技术正在不断地发展,应用也比较广泛。
二、数字图像处理的常用方法
所谓图像增强,就是为了改善画质,为了使人们更好地从图像中获取信息,当然,在本例中,应该是为了使计算机更好地识别图像中的信息,就是改善視觉上的效果。图像增强其实在很多方面都有应用,因为它方法简单却效果明显,在数字图像识别领域具有十分重要的地位。以下是三种常用的图像增强的方法:
1.灰度增强
灰度增强的意义是指在图像处理中按照一定变换关系逐点地改变原来图像中每一个像素的灰度值。图像会变得更加鲜明,这是灰度增强的好处。
2.锐化
由于客观因素,比如信道的通带过窄或者摄像系统的聚焦不好,就可能会造成图像中目标信息的轮廓模糊不清。而图像锐化技术就是一种可以加重图像的轮廓的技术。一般来说,经过锐化技术处理过的图像往往比精确再现的图像更加清晰。所以说,图像锐化的作用就是针对处于目标轮廓上的像素,使其灰度值比原来小的更小,比原来大的更大,而对轮廓以外的像素不起作用。
3.中值滤波
中值滤波是一种非线性处理技术,它的主要目的抑制图像的噪声。我们知道,在一维情况下,中值滤波器它是一个含有奇数个像素的窗口。中值滤波的处理原理是对于位于窗口正中像素的灰度值,就用窗口内个像素灰度值的中值代替。因为中值滤波不影响阶跃函数和斜坡函数,所以它对图像边界也是有保护作用的。
三、识别步骤
1.数据获取:数据获取的过程是指为使计算机能够对各种现象进行分类识别,用计算机可以运算的符号来表示所研究对象的二维图像。通过采样、测量和一些量化处理,然后用向量或矩阵表示成二维的数字图像。
2.预处理:获取的图像都需要经过预处理,预处理的目的是去除噪声,加强有用的信息,同时其它因素或对输入测量仪器所造成的图像的像素退化现象进行复原。
3.特征提取和选择:因为图像包含了很多信息,所以由图像所得到数字图像中含有的数据量非常大。为了有效地实现信息的分类识别,要对最原始的数据先进行一定的变换,然后得到的取最能反映信息分类本质的特征。
4.分类决策:是指在我们所说的特征空间中用统计学的科学方法把被某些识别对象归为某一类别。在复查时,分类决策方法可以在一定层面上减少信息采集时的错误概率。
结束语
在本文中,我们所说的文章方向的数字图像识别技术其实是一个范围很大的技术领域,作者在此只是有选择地进行了一些研究。其实,仅就文章方向的数字图像识别技术这一部分而言,就有很多需要继续完成的工作,可将这些问题与其它一些数字图像处理方法进一步同步实现,如图像的膨胀腐蚀、图像矩阵的变换、各种编码图像的读写与显示,以及图像的几何变换。这一部分可以做成一个专用的文字图像处理平台。在一定意义上,本次研究基本明白了文字的数字图像处理与识别的常用技术,而还有很多具体的数字图像识别处理方法可以继续学习并实现,研究中的识别方法还可以进一步研究和更新。(作者单位:沈阳师范大学学院科信软件学院)
参考文献:
[1]郑建英.数字图像处理技术[J].内蒙古科技与经济,2002(5):58-59;
[2]章毓晋.中国图像工程及当前的几个研究热点[J].计算机辅助设计与图形学学报,2002,14(6):489-493;
[3]周杰,卢春雨,张长水等.人脸自动识别方法综述[J].电子学报,2000,28(4):102-106;