论文部分内容阅读
近年来,图像处理技术在很多行业都得到了卓有成效的应用,一定程度上为这些行业提供了一种新的方法,新的工具。笔者拟将图像处理技术应用到图书馆藏书清点工作中,做出一些初步的探索、研究一些可行的方法。
本文分析了书脊图像的特点,提出对书脊图像进行分割以获得书目的数量信息的思路;并且结合汉字识别技术提取书脊图像的特征,完成识别的目的。本文详细陈述了书脊图像识别的全过程。首先利用canny算子对书脊图像进行边缘检测,由于检测后的图像书脊边界部分呈较连续的直线特征,因此利用直线跟踪技术提取出边界线。然后根据阈值判断书脊图像区域,完成书籍数量信息的提取工作。其次利用投影阈值分割算法将单个的字符提取出来,并结合模式识别中字符识别的技术来进行特征提取,并综合其它可以提取的特征如颜色,字符间距,字符数量等来达到区分子图像的目的,也即可以做到识别书籍的目的。本文提出将数字字母与汉字识别分别进行,并参照了常见的汉字识别技术对本应用的汉字识别作出分析。
我们采用MATLAB做为算法分析的工具,MATLAB的强大功能和编程的简易性,加快了我们开发的进程,提高了开发的效率。